2024-level3-finalproject-nlp-8
/

literature-QG-noanswer

Text2Text Generation

Inference Endpoints

Model card Files Files and versions Community

literature-QG-noanswer / trainer_state.json

exena's picture

Upload folder using huggingface_hub

2b60d9f verified 4 months ago

history blame contribute delete

No virus

4.33 kB

	{
	"best_metric": 2.6636579036712646,
	"best_model_checkpoint": "./trained_qg_models/Sehong/kobart-QuestionGeneration/checkpoint-38",
	"epoch": 0.08444444444444445,
	"eval_steps": 2,
	"global_step": 38,
	"is_hyper_param_search": false,
	"is_local_process_zero": true,
	"is_world_process_zero": true,
	"log_history": [
	{
	"epoch": 0.0,
	"eval_loss": 5.902864456176758,
	"eval_runtime": 1.4756,
	"eval_samples_per_second": 67.767,
	"eval_steps_per_second": 33.883,
	"step": 2
	},
	{
	"epoch": 0.01,
	"eval_loss": 5.208019256591797,
	"eval_runtime": 1.4619,
	"eval_samples_per_second": 68.403,
	"eval_steps_per_second": 34.202,
	"step": 4
	},
	{
	"epoch": 0.01,
	"eval_loss": 3.895578622817993,
	"eval_runtime": 1.4664,
	"eval_samples_per_second": 68.194,
	"eval_steps_per_second": 34.097,
	"step": 6
	},
	{
	"epoch": 0.02,
	"eval_loss": 3.8213446140289307,
	"eval_runtime": 1.4649,
	"eval_samples_per_second": 68.265,
	"eval_steps_per_second": 34.133,
	"step": 8
	},
	{
	"epoch": 0.02,
	"eval_loss": 3.764300584793091,
	"eval_runtime": 1.4644,
	"eval_samples_per_second": 68.288,
	"eval_steps_per_second": 34.144,
	"step": 10
	},
	{
	"epoch": 0.03,
	"eval_loss": 3.6308743953704834,
	"eval_runtime": 1.4631,
	"eval_samples_per_second": 68.347,
	"eval_steps_per_second": 34.173,
	"step": 12
	},
	{
	"epoch": 0.03,
	"eval_loss": 3.361673355102539,
	"eval_runtime": 1.4641,
	"eval_samples_per_second": 68.303,
	"eval_steps_per_second": 34.151,
	"step": 14
	},
	{
	"epoch": 0.04,
	"eval_loss": 3.1514954566955566,
	"eval_runtime": 1.4639,
	"eval_samples_per_second": 68.309,
	"eval_steps_per_second": 34.154,
	"step": 16
	},
	{
	"epoch": 0.04,
	"eval_loss": 3.0636467933654785,
	"eval_runtime": 1.464,
	"eval_samples_per_second": 68.307,
	"eval_steps_per_second": 34.153,
	"step": 18
	},
	{
	"epoch": 0.04,
	"eval_loss": 3.003873348236084,
	"eval_runtime": 1.4646,
	"eval_samples_per_second": 68.28,
	"eval_steps_per_second": 34.14,
	"step": 20
	},
	{
	"epoch": 0.05,
	"eval_loss": 2.9242141246795654,
	"eval_runtime": 1.462,
	"eval_samples_per_second": 68.4,
	"eval_steps_per_second": 34.2,
	"step": 22
	},
	{
	"epoch": 0.05,
	"eval_loss": 2.862067222595215,
	"eval_runtime": 1.4652,
	"eval_samples_per_second": 68.25,
	"eval_steps_per_second": 34.125,
	"step": 24
	},
	{
	"epoch": 0.06,
	"eval_loss": 2.82049560546875,
	"eval_runtime": 1.4635,
	"eval_samples_per_second": 68.331,
	"eval_steps_per_second": 34.165,
	"step": 26
	},
	{
	"epoch": 0.06,
	"eval_loss": 2.7904272079467773,
	"eval_runtime": 1.4633,
	"eval_samples_per_second": 68.337,
	"eval_steps_per_second": 34.168,
	"step": 28
	},
	{
	"epoch": 0.07,
	"eval_loss": 2.7638421058654785,
	"eval_runtime": 1.463,
	"eval_samples_per_second": 68.352,
	"eval_steps_per_second": 34.176,
	"step": 30
	},
	{
	"epoch": 0.07,
	"eval_loss": 2.739243268966675,
	"eval_runtime": 1.4634,
	"eval_samples_per_second": 68.336,
	"eval_steps_per_second": 34.168,
	"step": 32
	},
	{
	"epoch": 0.08,
	"eval_loss": 2.7041234970092773,
	"eval_runtime": 1.4667,
	"eval_samples_per_second": 68.182,
	"eval_steps_per_second": 34.091,
	"step": 34
	},
	{
	"epoch": 0.08,
	"eval_loss": 2.684762954711914,
	"eval_runtime": 1.4638,
	"eval_samples_per_second": 68.317,
	"eval_steps_per_second": 34.158,
	"step": 36
	},
	{
	"epoch": 0.08,
	"eval_loss": 2.6636579036712646,
	"eval_runtime": 1.4652,
	"eval_samples_per_second": 68.252,
	"eval_steps_per_second": 34.126,
	"step": 38
	}
	],
	"logging_steps": 100,
	"max_steps": 1800,
	"num_input_tokens_seen": 0,
	"num_train_epochs": 4,
	"save_steps": 2,
	"total_flos": 23169985413120.0,
	"train_batch_size": 2,
	"trial_name": null,
	"trial_params": null
	}