metadata

license: other
base_model: TencentARC/Mistral_Pro_8B_v0.1
tags:
  - generated_from_trainer
model-index:
  - name: sft-4e-exp2
    results: []

sft-4e-exp2

This model is an experimental fine-tuned version of TencentARC/Mistral_Pro_8B_v0.1.

This model is intended for safety research only.

Model description

More information needed

More information needed

More information needed

The following hyperparameters were used during training:

arc (25)	hellaswag (10)	mmlu (5)	truthfulqa_mc (20)	winogrande	gsm8k (exact)	avg (exact)
0.6305	0.8413	0.6041	0.5535	0.7624	0.5754	0.6612

This version is to be used for non-commercial research purposes only. We will release open models after we have finished training and evaluations.