rspati - Casual Indonesian Daily Chat Assistant

rspati-chat adalah model kecerdasan buatan hasil fine-tuning dari Qwen2.5-7B-Instruct yang dirancang khusus untuk menjadi asisten obrolan sehari-hari yang ramah, hangat, dan kasual dalam Bahasa Indonesia.

Model ini dilatih menggunakan metode QLoRA dengan dataset khusus yang berfokus pada dinamika percakapan netizen Indonesia secara riil, menjadikannya sangat fleksibel dalam memahami berbagai variasi ketikan manusia sehari-hari.

Karakteristik Utama Model:

  • Toleran terhadap Typo & Singkatan: Mampu memahami ketikan singkatan gaul atau typo yang padat (seperti 'dmn y tpt mkn yg enk tp mrh bgt', 'gpp', 'mks').
  • Proaktif terhadap Chat Singkat (Dry Text): Jika pengguna hanya mengirim pesan pendek seperti 'p', 'y', 'g', atau 'males', model tidak akan membalas secara kaku melainkan merespons secara hangat dan memicu kelanjutan obrolan.
  • Responsif terhadap Kalimat Nyeleneh (Out of Context): Jika diajak berbicara hal-hal yang tidak masuk akal, model akan membalas dengan candaan ringan atau humor yang sopan sebelum mengarahkan obrolan kembali secara natural.
  • Empati Tinggi: Mampu menjadi pendengar yang baik untuk keluh kesah ringan seputar kelelahan kerja, sekolah, maupun kehidupan sehari-hari.

Spesifikasi Latihan:

  • Developed by: dhiiitraaa
  • Base Model: unsloth/Qwen2.5-7B-Instruct-bnb-4bit
  • Metode Pelatihan: QLoRA (Rank = 16, Alpha = 32)
  • Framework: Unsloth
  • License: apache-2.0
  • Language: Bahasa Indonesia (Casual/Gaul), English

Cara Penggunaan (Inference):

Untuk mendapatkan performa gaya bahasa kasual terbaik dari rspati, gunakan System Prompt di bawah ini secara konsisten:

System Prompt:

Kamu adalah rspati, asisten chat sehari-hari yang ramah, santai, dan menggunakan bahasa Indonesia kasual yang hangat. Bantu pengguna menyelesaikan tugas sederhana atau sekadar mengobrol santai.

Contoh Kode Python (menggunakan Unsloth):

from unsloth import FastLanguageModel
import torch

# 1. Load Model dari Hugging Face
model, tokenizer = FastLanguageModel.from_pretrained(
    model_name = "dhiiitraaa/rspati-chat", # Repositori baru Anda
    max_seq_length = 2048,
    dtype = None,
    load_in_4bit = True,
)
FastLanguageModel.for_inference(model)

# 2. Definisikan Chat
messages = [
    {
        "role": "system", 
        "content": "Kamu adalah rspati, asisten chat sehari-hari yang ramah, santai, dan menggunakan bahasa Indonesia kasual yang hangat. Bantu pengguna menyelesaikan tugas sederhana atau sekadar mengobrol santai."
    },
    {
        "role": "user", 
        "content": "eh dmn y tpt mkn yg enk tp mrh bgt"
    }
]

# 3. Proses Tokenisasi & Generate
inputs = tokenizer.apply_chat_template(messages, tokenize=True, add_generation_prompt=True, return_tensors="pt").to("cuda")
outputs = model.generate(input_ids=inputs, max_new_tokens=150, temperature=0.6, use_cache=True)

# 4. Tampilkan Hasil
raw_response = tokenizer.batch_decode(outputs)[0]
clean_response = raw_response.split("<|im_start|>assistant\n")[-1].split("<|im_end|>")[0].strip()
print(clean_response)


---

### Catatan Penting untuk Pemanggilan Model di Masa Depan:
Saat Anda memanggil kembali model ini dari notebook Google Colab baru, pastikan parameter `model_name` telah diubah untuk merujuk pada alamat baru Anda:

```python
model, tokenizer = FastLanguageModel.from_pretrained(
    model_name = "dhiiitraaa/rspati-chat", # Gunakan alamat ini
    ...
)
Downloads last month
265
GGUF
Model size
8B params
Architecture
qwen2
Hardware compatibility
Log In to add your hardware

8-bit

Inference Providers NEW
This model isn't deployed by any Inference Provider. ๐Ÿ™‹ Ask for provider support

Model tree for dhiiitraaa/rspati-chat

Base model

Qwen/Qwen2.5-7B
Quantized
(20)
this model