lole25
/

phi-2-dpo-ultrachat-lora

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

phi-2-dpo-ultrachat-lora / train_results.json

lole25's picture

Model save

1e1c504 verified 8 months ago

194 Bytes

	{
	"epoch": 0.99,
	"train_loss": 0.6931231824975265,
	"train_runtime": 1147.8486,
	"train_samples": 6113,
	"train_samples_per_second": 5.326,
	"train_steps_per_second": 0.083
	}