TRM-textV3.6 (Full SFT Optimized)

summerMC/TRM-textv3.5 に250Mトークンの継続事前学習と、databricks-dolly-15k-ja 全量を用いたフルSFTを施した最終評価版です。

評価結果 (0-shot SFT後)

Task Metric Value
ARC-Easy acc_norm 0.3300
HellaSwag acc_norm 0.2638
PIQA acc_norm 0.5539

※15kサンプルのフルSFTにより、プロンプト形式への適応を最大化しています。

Downloads last month
171
Safetensors
Model size
84.3M params
Tensor type
BF16
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for summerMC/TRM-textV3.6

Finetuned
(1)
this model