dball
/

zephyr-7b-dpo-qlora-no-sft

alignment-handbook

Generated from Trainer

4-bit precision

Model card Files Files and versions Metrics Training metrics Community

zephyr-7b-dpo-qlora-no-sft / train_results.json

dball's picture

Model save

42d7b6a verified 5 months ago

raw history blame

No virus

196 Bytes

	{
	"epoch": 1.0,
	"train_loss": 0.5756704107174588,
	"train_runtime": 163576.2451,
	"train_samples": 61135,
	"train_samples_per_second": 0.374,
	"train_steps_per_second": 0.047
	}