Image-Text-to-Text
Transformers
Safetensors
Russian
English
qwen3_5_moe
conversational

Это экспериментальная версия.

Возможны проблемы в ризонинге на русском языке(не замеряли, не знаем). Но должна быть чуть лучше в русском языке, нежели базовая.

Метрики не известны, не замеряли.

Назначение: для своих "домашних" fine-тюнов.

Как трейнили:

  • lora_r=64, lora_alpha=128, lr=5e-5, num_epochs=1, seq_length=16384, 8 GPU w/ DeepSpeed Zero-1, micro_batch_size=1, gradient_accumulation_steps=4, total effective batch=32
  • Датасеты: ZeroAgency/big-russian-dataset-3, ZeroAgency/reasoning_dataset + 3 приватных датасета.
Downloads last month
30
Safetensors
Model size
36B params
Tensor type
BF16
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for ZeroAgency/Zero-Qwen3.6-35B-A3B-beta1

Finetuned
(128)
this model

Datasets used to train ZeroAgency/Zero-Qwen3.6-35B-A3B-beta1