chanchan7
/

llama-7b-dpo-qlora

alignment-handbook

Generated from Trainer

4-bit precision

Model card Files Files and versions Metrics Training metrics Community

llama-7b-dpo-qlora / train_results.json

chanchan7's picture

Model save

aef4b53 verified 4 months ago

raw history blame

No virus

194 Bytes

	{
	"epoch": 1.0,
	"train_loss": 0.598351346759896,
	"train_runtime": 27817.4474,
	"train_samples": 61135,
	"train_samples_per_second": 2.198,
	"train_steps_per_second": 0.069
	}