CALI-99M

CALI (Computer Assistant Lightweight Intelligence) adalah model bahasa ringan eksperimental yang dilatih dari nol menggunakan dataset bahasa Indonesia dan Inggris dengan skala terbatas.

Model ini dibuat untuk eksperimen arsitektur transformer ringan, efisiensi model kecil, dan penelitian training language model menggunakan resource serta dataset terbatas.

Model ini BUKAN foundation model skala besar dan TIDAK dilatih menggunakan huge-scale internet dataset seperti model komersial modern.


Catatan Penting

Karena ukuran dataset relatif kecil, model dapat memiliki bias yang cukup kuat terhadap domain terakhir atau domain yang paling dominan saat proses pretraining. Fine-tuning, alignment, atau continued pretraining sangat disarankan tergantung tujuan penggunaan model.


Detail Model

Property Value
Parameters 99M
Layers 11
Hidden Size 768
Attention Heads 4
KV Heads 1
Head Dimension 192
FFN Dimension 2304
Context Length 1024
Vocabulary Size 32000

Pretraining

Model dilatih dari nol menggunakan dataset yang dipilih dan difilter sesuai kebutuhan eksperimen model, bukan untuk mengejar ukuran dataset sebesar mungkin.

Dataset meliputi:

  • Teks bahasa Inggris
  • Teks bahasa Indonesia
  • Wikipedia
  • Berita
  • Dokumen umum
  • Kode program

Progress Training

Tokens Step Final Loss
250M 13,564 3.53
350M 18,989 3.53
450M 24,415 4.69
614M 33,356 2.71

Notes

  • Arsitektur eksperimental
  • Memerlukan custom inference implementation
  • Menggunakan Grouped-Query Attention (GQA)
  • Ditujukan untuk riset dan eksperimen

Citation

If you use or reference this model in your research or projects, please cite:

@article{cali2026,
  title        = {CALI 0.1B},
  author       = {Sandroeth},
  year         = {2026},
  publisher    = {Hugging Face},
  url          = {https://huggingface.co/Sandroeth/cali-0.1B}

Author

Sandroeth

Downloads last month
636
Safetensors
Model size
0.1B params
Tensor type
F32
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support