Instructions to use JibayAi/Jibay_2 with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Libraries
- Transformers
How to use JibayAi/Jibay_2 with Transformers:
# Use a pipeline as a high-level helper from transformers import pipeline pipe = pipeline("text-generation", model="JibayAi/Jibay_2") messages = [ {"role": "user", "content": "Who are you?"}, ] pipe(messages)# Load model directly from transformers import AutoModelForCausalLM model = AutoModelForCausalLM.from_pretrained("JibayAi/Jibay_2", dtype="auto") - Notebooks
- Google Colab
- Kaggle
- Local Apps Settings
- vLLM
How to use JibayAi/Jibay_2 with vLLM:
Install from pip and serve model
# Install vLLM from pip: pip install vllm # Start the vLLM server: vllm serve "JibayAi/Jibay_2" # Call the server using curl (OpenAI-compatible API): curl -X POST "http://localhost:8000/v1/chat/completions" \ -H "Content-Type: application/json" \ --data '{ "model": "JibayAi/Jibay_2", "messages": [ { "role": "user", "content": "What is the capital of France?" } ] }'Use Docker
docker model run hf.co/JibayAi/Jibay_2
- SGLang
How to use JibayAi/Jibay_2 with SGLang:
Install from pip and serve model
# Install SGLang from pip: pip install sglang # Start the SGLang server: python3 -m sglang.launch_server \ --model-path "JibayAi/Jibay_2" \ --host 0.0.0.0 \ --port 30000 # Call the server using curl (OpenAI-compatible API): curl -X POST "http://localhost:30000/v1/chat/completions" \ -H "Content-Type: application/json" \ --data '{ "model": "JibayAi/Jibay_2", "messages": [ { "role": "user", "content": "What is the capital of France?" } ] }'Use Docker images
docker run --gpus all \ --shm-size 32g \ -p 30000:30000 \ -v ~/.cache/huggingface:/root/.cache/huggingface \ --env "HF_TOKEN=<secret>" \ --ipc=host \ lmsysorg/sglang:latest \ python3 -m sglang.launch_server \ --model-path "JibayAi/Jibay_2" \ --host 0.0.0.0 \ --port 30000 # Call the server using curl (OpenAI-compatible API): curl -X POST "http://localhost:30000/v1/chat/completions" \ -H "Content-Type: application/json" \ --data '{ "model": "JibayAi/Jibay_2", "messages": [ { "role": "user", "content": "What is the capital of France?" } ] }' - Docker Model Runner
How to use JibayAi/Jibay_2 with Docker Model Runner:
docker model run hf.co/JibayAi/Jibay_2
Jibay 2
Jibay 2 is a lightweight, open-source language model released in two major milestones: first published in Ordibehesht 1404 (April/May 2025) and later made fully open-source and publicly available in Khordad 1405 (June 2026).
Jibay 2 is designed to be simple, trainable, and customizable. It is built upon the strong foundation of the Qwen 3 family and serves as a practical, efficient alternative for developers, researchers, and AI enthusiasts who need a controllable model without excessive computational overhead.
📌 Key Specifications
| Feature | Value |
|---|---|
| Context Length | 32,768 tokens (input + output combined) |
| Active Parameters | 2 billion |
| MoE (Mixture of Experts) | Not supported |
| Training Base | Qwen 3 |
| Knowledge Cutoff | Early 2025 (end of 1404) |
| Release (First publish) | Ordibehesht 1404 (April/May 2025) |
| Open-Source Release | Khordad 1405 (May/June 2026) |
🧠 Intended Use
Jibay 2 is suitable for:
- Fine-tuning on domain-specific data
- On-device or edge AI applications
- Research and educational purposes
- Lightweight agentic workflows (with function calling capabilities)
- Rapid prototyping and experimentation
The model can be retrained, extended, or adapted to any field or language without major infrastructure requirements.
📊 Benchmarks
All benchmarks reported below have been tested and verified by the Jibay team. Detailed testing methodology remains internal.
| Benchmark | Score (%) | Domain |
|---|---|---|
| MMLU | ~56.9% | General knowledge & problem solving |
| GSM8K | ~70.0% | Math reasoning (grade school level) |
| ARC (Challenge) | ~43.0% | Scientific reasoning (hard) |
| HumanEval | ~68.0% | Python code generation |
| BoolQ | ~79.0% | Yes/No reading comprehension |
| HellaSwag | ~61.1% | Commonsense sentence completion |
| BFCL Overall | 55.0% | Function calling & tool use (Berkeley) |
| Category Avg | 51.2% | Average across BFCL categories |
| Persian JiChat | 41.3٪ | Exclusive and private benchmark for Persian conversation |
📢 These scores reflect the base Jibay 2 model without task-specific fine-tuning.
🚀 Usage
Recommended Method (GGUF – Optimized)
For best performance, especially on consumer hardware, use the GGUF quantized version (highly optimized).
Alternative Method (Direct Python)
from jibay2.modeling_jibay2 import Jibay2ForCausalLM
Note: While the native Python class is available, GGUF is strongly recommended for production use.
⚙️ Training & Customization
Jibay 2 does not use MoE (Mixture of Experts), meaning all parameters are active during inference, making it easier to understand, debug, and fine-tune.
You can retrain the model entirely or adapt it to specific tasks such as:
- Medical or legal text processing
- Code generation for niche languages
- Conversational AI in low-resource languages
- Scientific document understanding
📜 License & Availability
Jibay 2 became publicly available and open-source in Khordad 1405 (May/June 2026).
All core weights, inference code, and documentation are accessible to the community.
📬 Contact
For inquiries, partnerships, or support:
📧 info@jibay.ir
⚠️ Important Notes
- Knowledge is current only until early 2025 (end of 1404).
- The model is not a Mixture of Experts architecture.
- GGUF version is recommended over native PyTorch for most use cases.
- Benchmark details, test splits, and exact evaluation parameters remain internal to the Jibay team.
جیبای ۲
جیبای ۲ یک مدل زبانی سبک، متنباز و قابل شخصیسازی است که در دو مرحلهٔ مهم منتشر شد: انتشار اولیه در اردیبهشت ۱۴۰۴ و انتشار عمومی و متنباز در خرداد ۱۴۰۵.
جیبای ۲ بر اساس خانواده مدل Qwen 3 آموزش دیده است و بهعنوان یک گزینهٔ ساده، کارآمد و قابل آموزش برای توسعهدهندگان، پژوهشگران و علاقهمندان به هوش مصنوعی طراحی شده است.
📌 مشخصات فنی
| ویژگی | مقدار |
|---|---|
| طول زمینه | ۳۲,۷۶۸ توکن (مجموع ورودی و خروجی) |
| پارامترهای فعال | ۲ میلیارد |
| پشتیبانی از MoE | خیر |
| پایهٔ آموزش | Qwen 3 |
| تاریخ قطع اطلاعات | اوایل ۲۰۲۵ (اواخر سال ۱۴۰۴) |
| انتشار اولیه | اردیبهشت ۱۴۰۴ |
| متنباز شدن | خرداد ۱۴۰۵ |
🧠 کاربردهای پیشنهادی
جیبای ۲ برای موارد زیر مناسب است:
- تنظیم دقیق (Fine-tuning) روی دادههای تخصصی
- اجرا روی دستگاههای شخصی یا لبه (Edge)
- اهداف تحقیقاتی و آموزشی
- ساخت عاملهای هوشمند سبک (با قابلیت فراخوانی ابزار)
- نمونهسازی سریع و آزمایش
این مدل قابلیت بازآموزی، توسعه و تطبیق با هر حوزه یا زبانی را بدون نیاز به زیرساخت سنگین دارد.
📊 بنچمارکها
تمامی بنچمارکهای زیر توسط تیم جیبای تست و تأیید شدهاند. جزئیات روش آزمون داخلی است.
| بنچمارک | امتیاز (درصد) | حوزه |
|---|---|---|
| MMLU | ~۵۶.۹٪ | دانش عمومی و حل مسئله |
| GSM8K | ~۷۰.۰٪ | استدلال ریاضی (سطح دبستان) |
| ARC (Challenge) | ~۴۳.۰٪ | استدلال علمی (سخت) |
| HumanEval | ~۶۸.۰٪ | تولید کد پایتون |
| BoolQ | ~۷۹.۰٪ | درک مطلب بله/خیر |
| HellaSwag | ~۶۱.۱٪ | تکمیل جمله با عقل سلیم |
| BFCL Overall | ۵۵.۰٪ | فراخوانی ابزار و تابع |
| Category Avg | ۵۱.۲٪ | میانگین دستهبندی BFCL |
| Persian JiChat | ۴۱.۳٪ | بنچمارک اختصاصی و خصوصی برای گفتگوی فارسی |
📢 این نمرات مربوط به مدل پایهٔ جیبای ۲ بدون تنظیم دقیق روی وظیفهٔ خاصی است.
🚀 روش استفاده
روش پیشنهادی (GGUF – بهینه)
برای بهترین عملکرد، بهویژه روی سختافزار معمولی، از نسخه GGUF استفاده کنید (بسیار بهینهشده).
روش جایگزین (پایتون مستقیم)
from jibay2.modeling_jibay2 import Jibay2ForCausalLM
توجه: اگرچه کلاس پایتون در دسترس است، برای استفادهٔ واقعی، نسخهٔ GGUF بسیار توصیه میشود.
⚙️ آموزش و شخصیسازی
جیبای ۲ از MoE استفاده نمیکند، یعنی تمام پارامترها در حین استنتاج فعال هستند که درک، اشکالزدایی و تنظیم مدل را آسانتر میکند.
میتوانید مدل را به طور کامل بازآموزی کنید یا آن را برای وظایف خاصی تطبیق دهید، از جمله:
- پردازش متون پزشکی یا حقوقی
- تولید کد برای زبانهای برنامهنویسی خاص
- چتبات در زبانهای کممنبع
- درک متون علمی
📜 مجوز و دسترسی
جیبای ۲ در خرداد ۱۴۰۵ به صورت عمومی و متنباز در دسترس قرار گرفت.
وزنهای اصلی، کد استنتاج و مستندات برای جامعه در دسترس است.
📬 تماس
برای همکاری، سؤال یا پشتیبانی:
📧 info@jibay.ir
⚠️ نکات مهم
- اطلاعات مدل فقط تا اوایل ۲۰۲۵ (اواخر سال ۱۴۰۴) بهروز است.
- مدل از معماری Mixture of Experts استفاده نمیکند.
- نسخهٔ GGUF نسبت به نسخهٔ پایتون خام توصیه میشود.
- جزئیات بنچمارکها و روش آزمون دقیق، داخلی و محفوظ است.
jibay.ir | info@jibay.ir
- Downloads last month
- 70

