Minbyul
/

meditron-7b-dpo-full-sft-wo-live_qa

Text Generation

alignment-handbook

Generated from Trainer

Inference Endpoints

text-generation-inference

Model card Files Files and versions Community

meditron-7b-dpo-full-sft-wo-live_qa / train_results.json

Minbyul's picture

Model save

2ebd25e verified about 2 months ago

raw history blame

No virus

193 Bytes

	{
	"epoch": 0.99,
	"train_loss": 0.5556549103029312,
	"train_runtime": 1091.242,
	"train_samples": 3974,
	"train_samples_per_second": 3.642,
	"train_steps_per_second": 0.057
	}