xinlai
/

Qwen2-7B-SFT-Step-DPO

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Qwen2-7B-SFT-Step-DPO / all_results.json

xinlai's picture

upload model

d5796e3 3 months ago

No virus

216 Bytes

	{
	"epoch": 8.0,
	"total_flos": 0.0,
	"train_loss": 0.15622181608736263,
	"train_runtime": 4721.8854,
	"train_samples": 7548,
	"train_samples_per_second": 12.788,
	"train_steps_per_second": 0.1
	}