Edit model card

You need to agree to share your contact information to access this model

This repository is publicly accessible, but you have to accept the conditions to access its files and content.

Log in or Sign Up to review the conditions and access this model content.

SilvaAI-MechaMinds-2.7b-Indo-QA

Deskripsi Model:

SilvaAI-MechaMinds-2.7b-Indo-QA adalah model berbasis transformer yang dirancang khusus untuk pembangkitan teks percakapan dalam bahasa Indonesia. Model ini dilatih menggunakan dataset percakapan yang luas dan dioptimalkan untuk menghasilkan tanggapan yang relevan dan kohesif dalam bahasa Indonesia. Model ini cocok untuk berbagai aplikasi seperti chatbot, virtual assistant, atau aplikasi berbasis AI lainnya yang berfokus pada bahasa Indonesia.

Dikembangkan oleh: MechaMinds
Tipe Model: Language Model (Generative, Causal Language Model)
Bahasa: Bahasa Indonesia
Lisensi: Apache License 2.0
Model Terkait: Nusantara Series (versi 2.7b)

Cara Memulai dengan Model

Untuk memulai menggunakan model ini, Anda bisa mengikuti langkah-langkah berikut menggunakan Python dan library transformers:

Contoh Penggunaan Model

from transformers import AutoModelForCausalLM, AutoTokenizer
device = "cuda"  # perangkat untuk memuat model

# Memuat model dan tokenizer
model = AutoModelForCausalLM.from_pretrained(
    "gabrielb/SilvaAI-MechaMinds-2.7b-Indo-QA",
    torch_dtype="auto",
    device_map="auto"
)
tokenizer = AutoTokenizer.from_pretrained("gabrielb/SilvaAI-MechaMinds-2.7b-Indo-QA")

# Contoh prompt
prompt = "Apa itu Python?"
messages = [
    {"role": "system", "content": "Kamu adalah Silva, asisten AI yang pintar."},
    {"role": "user", "content": prompt}
]
text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True
)
model_inputs = tokenizer([text], return_tensors="pt").to(device)

# Menghasilkan teks
generated_ids = model.generate(
    model_inputs.input_ids,
    max_new_tokens=512
)
generated_ids = [
    output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
]

response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
print(response)

Cara Mengunduh Model untuk Penggunaan Offline

model.save_pretrained("./SilvaAI-MechaMinds-2.7b-Indo-QA")
tokenizer.save_pretrained("./SilvaAI-MechaMinds-2.7b-Indo-QA")

Penggunaan:

Model SilvaAI-MechaMinds-2.7b-Indo-QA dapat digunakan untuk berbagai keperluan, seperti:

  • Pembangunan chatbot berbasis AI
  • Virtual assistant untuk layanan pelanggan
  • Pembangkitan teks otomatis dalam aplikasi percakapan
  • Latihan dan simulasi percakapan dalam bahasa Indonesia
  • Tanya jawab terkait pemrograman, membantu pengguna dalam menemukan solusi untuk masalah kode dan konsep pemrograman.
  • Generate kode otomatis dalam berbagai bahasa pemrograman, termasuk Python, JavaScript, C++, dan lainnya, untuk mendukung berbagai tugas pemrograman.

Misuse and Out-of-scope Use

Model ini tidak boleh digunakan untuk menghasilkan konten yang menyinggung, memprovokasi, atau merugikan individu atau kelompok. Selain itu, model ini tidak dilatih untuk memberikan jawaban yang 100% faktual, sehingga tidak direkomendasikan untuk digunakan sebagai sumber informasi kritis atau ilmiah.

Risiko, Keterbatasan, dan Bias

Meskipun model ini dilatih menggunakan dataset yang luas, ia mungkin memiliki beberapa keterbatasan, seperti:

  • Bias Data: Model ini dilatih menggunakan data publik, sehingga mungkin mengandung bias atau stereotip yang ada dalam data tersebut.
  • Konten Tidak Sesuai: Model ini dapat menghasilkan konten yang tidak sesuai atau tidak akurat dalam konteks tertentu.
  • Pengguna model harus berhati-hati saat menggunakan model ini dalam skenario sensitif atau kritis. Berikut adalah contoh bagaimana bias dapat muncul:

Pelatihan

Data Pelatihan

Model SilvaAI-MechaMinds-2.7b-Indo-QA dilatih menggunakan dataset percakapan berbahasa Indonesia yang mencakup berbagai konteks, termasuk percakapan sehari-hari, interaksi layanan pelanggan, dan diskusi dalam berbagai topik.

Prosedur Pelatihan

Proses pelatihan model ini menggunakan teknik transformer-based language modeling yang dioptimalkan untuk menghasilkan teks percakapan yang alami dalam bahasa Indonesia. Model ini di-fine-tune menggunakan GPU dengan memanfaatkan framework PyTorch.

Sumber Daya

Model ini dilatih menggunakan infrastruktur GPU. Berikut adalah rincian dampak lingkungan dari proses pelatihan:

Tipe Perangkat Keras: GPU A100 80GB
Durasi Penggunaan: 7 jam

Credit

Model dilatih oleh Gabriel Batavia, Member of MechaMinds

Downloads last month
6
Safetensors
Model size
2.76B params
Tensor type
F32
·
Inference Examples
This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social visibility and check back later, or deploy to Inference Endpoints (dedicated) instead.

Model tree for gabrielb/SilvaAI-MechaMinds-2.7b-Indo-QA

Finetuned
(14)
this model

Dataset used to train gabrielb/SilvaAI-MechaMinds-2.7b-Indo-QA