dfm_detction_model / checkpoint-1008 /trainer_state.json

Upload folder using huggingface_hub

5540b3c verified 5 months ago

No virus

16.2 kB

	{
	"best_metric": 0.3229311406612396,
	"best_model_checkpoint": "deepfake_vs_real_image_detection/checkpoint-1008",
	"epoch": 63.0,
	"eval_steps": 500,
	"global_step": 1008,
	"is_hyper_param_search": false,
	"is_local_process_zero": true,
	"is_world_process_zero": true,
	"log_history": [
	{
	"epoch": 1.0,
	"eval_accuracy": 0.7091988130563798,
	"eval_loss": 1.3149911165237427,
	"eval_runtime": 4.5396,
	"eval_samples_per_second": 74.236,
	"eval_steps_per_second": 9.472,
	"step": 16
	},
	{
	"epoch": 2.0,
	"eval_accuracy": 0.7240356083086054,
	"eval_loss": 1.2351125478744507,
	"eval_runtime": 4.5534,
	"eval_samples_per_second": 74.011,
	"eval_steps_per_second": 9.443,
	"step": 32
	},
	{
	"epoch": 3.0,
	"eval_accuracy": 0.7477744807121661,
	"eval_loss": 1.1467523574829102,
	"eval_runtime": 4.5438,
	"eval_samples_per_second": 74.166,
	"eval_steps_per_second": 9.463,
	"step": 48
	},
	{
	"epoch": 4.0,
	"eval_accuracy": 0.7566765578635015,
	"eval_loss": 1.0724865198135376,
	"eval_runtime": 4.6718,
	"eval_samples_per_second": 72.136,
	"eval_steps_per_second": 9.204,
	"step": 64
	},
	{
	"epoch": 5.0,
	"eval_accuracy": 0.7744807121661721,
	"eval_loss": 1.0107314586639404,
	"eval_runtime": 4.63,
	"eval_samples_per_second": 72.787,
	"eval_steps_per_second": 9.287,
	"step": 80
	},
	{
	"epoch": 6.0,
	"eval_accuracy": 0.7804154302670623,
	"eval_loss": 0.9634671211242676,
	"eval_runtime": 4.5376,
	"eval_samples_per_second": 74.268,
	"eval_steps_per_second": 9.476,
	"step": 96
	},
	{
	"epoch": 7.0,
	"eval_accuracy": 0.7833827893175074,
	"eval_loss": 0.9228468537330627,
	"eval_runtime": 4.533,
	"eval_samples_per_second": 74.344,
	"eval_steps_per_second": 9.486,
	"step": 112
	},
	{
	"epoch": 8.0,
	"eval_accuracy": 0.7833827893175074,
	"eval_loss": 0.8867318034172058,
	"eval_runtime": 4.5995,
	"eval_samples_per_second": 73.269,
	"eval_steps_per_second": 9.349,
	"step": 128
	},
	{
	"epoch": 9.0,
	"eval_accuracy": 0.7893175074183977,
	"eval_loss": 0.8541847467422485,
	"eval_runtime": 4.5814,
	"eval_samples_per_second": 73.558,
	"eval_steps_per_second": 9.386,
	"step": 144
	},
	{
	"epoch": 10.0,
	"eval_accuracy": 0.7893175074183977,
	"eval_loss": 0.8184245824813843,
	"eval_runtime": 4.6031,
	"eval_samples_per_second": 73.211,
	"eval_steps_per_second": 9.341,
	"step": 160
	},
	{
	"epoch": 11.0,
	"eval_accuracy": 0.7804154302670623,
	"eval_loss": 0.7671003341674805,
	"eval_runtime": 4.5853,
	"eval_samples_per_second": 73.496,
	"eval_steps_per_second": 9.378,
	"step": 176
	},
	{
	"epoch": 12.0,
	"eval_accuracy": 0.7833827893175074,
	"eval_loss": 0.7202329039573669,
	"eval_runtime": 4.5949,
	"eval_samples_per_second": 73.342,
	"eval_steps_per_second": 9.358,
	"step": 192
	},
	{
	"epoch": 13.0,
	"eval_accuracy": 0.7833827893175074,
	"eval_loss": 0.6835761666297913,
	"eval_runtime": 4.5413,
	"eval_samples_per_second": 74.208,
	"eval_steps_per_second": 9.469,
	"step": 208
	},
	{
	"epoch": 14.0,
	"eval_accuracy": 0.7863501483679525,
	"eval_loss": 0.6513931155204773,
	"eval_runtime": 4.6483,
	"eval_samples_per_second": 72.5,
	"eval_steps_per_second": 9.251,
	"step": 224
	},
	{
	"epoch": 15.0,
	"eval_accuracy": 0.7952522255192879,
	"eval_loss": 0.6230782866477966,
	"eval_runtime": 4.5993,
	"eval_samples_per_second": 73.272,
	"eval_steps_per_second": 9.349,
	"step": 240
	},
	{
	"epoch": 16.0,
	"eval_accuracy": 0.8041543026706232,
	"eval_loss": 0.5948796272277832,
	"eval_runtime": 4.5704,
	"eval_samples_per_second": 73.735,
	"eval_steps_per_second": 9.408,
	"step": 256
	},
	{
	"epoch": 17.0,
	"eval_accuracy": 0.8071216617210683,
	"eval_loss": 0.5689114332199097,
	"eval_runtime": 4.5933,
	"eval_samples_per_second": 73.367,
	"eval_steps_per_second": 9.361,
	"step": 272
	},
	{
	"epoch": 18.0,
	"eval_accuracy": 0.8130563798219584,
	"eval_loss": 0.5446034669876099,
	"eval_runtime": 4.5362,
	"eval_samples_per_second": 74.291,
	"eval_steps_per_second": 9.479,
	"step": 288
	},
	{
	"epoch": 19.0,
	"eval_accuracy": 0.8130563798219584,
	"eval_loss": 0.5227214097976685,
	"eval_runtime": 4.5669,
	"eval_samples_per_second": 73.791,
	"eval_steps_per_second": 9.415,
	"step": 304
	},
	{
	"epoch": 20.0,
	"eval_accuracy": 0.8189910979228486,
	"eval_loss": 0.5031161308288574,
	"eval_runtime": 4.5479,
	"eval_samples_per_second": 74.1,
	"eval_steps_per_second": 9.455,
	"step": 320
	},
	{
	"epoch": 21.0,
	"eval_accuracy": 0.8160237388724035,
	"eval_loss": 0.48820197582244873,
	"eval_runtime": 4.5452,
	"eval_samples_per_second": 74.145,
	"eval_steps_per_second": 9.461,
	"step": 336
	},
	{
	"epoch": 22.0,
	"eval_accuracy": 0.8130563798219584,
	"eval_loss": 0.47535890340805054,
	"eval_runtime": 4.6769,
	"eval_samples_per_second": 72.057,
	"eval_steps_per_second": 9.194,
	"step": 352
	},
	{
	"epoch": 23.0,
	"eval_accuracy": 0.8130563798219584,
	"eval_loss": 0.4620312452316284,
	"eval_runtime": 4.5546,
	"eval_samples_per_second": 73.992,
	"eval_steps_per_second": 9.441,
	"step": 368
	},
	{
	"epoch": 24.0,
	"eval_accuracy": 0.8130563798219584,
	"eval_loss": 0.44609472155570984,
	"eval_runtime": 4.562,
	"eval_samples_per_second": 73.87,
	"eval_steps_per_second": 9.426,
	"step": 384
	},
	{
	"epoch": 25.0,
	"eval_accuracy": 0.8160237388724035,
	"eval_loss": 0.4364510774612427,
	"eval_runtime": 4.6256,
	"eval_samples_per_second": 72.855,
	"eval_steps_per_second": 9.296,
	"step": 400
	},
	{
	"epoch": 26.0,
	"eval_accuracy": 0.8249258160237388,
	"eval_loss": 0.42621392011642456,
	"eval_runtime": 4.5891,
	"eval_samples_per_second": 73.434,
	"eval_steps_per_second": 9.37,
	"step": 416
	},
	{
	"epoch": 27.0,
	"eval_accuracy": 0.827893175074184,
	"eval_loss": 0.4176171123981476,
	"eval_runtime": 4.7205,
	"eval_samples_per_second": 71.39,
	"eval_steps_per_second": 9.109,
	"step": 432
	},
	{
	"epoch": 28.0,
	"eval_accuracy": 0.8338278931750742,
	"eval_loss": 0.40912118554115295,
	"eval_runtime": 4.6413,
	"eval_samples_per_second": 72.609,
	"eval_steps_per_second": 9.265,
	"step": 448
	},
	{
	"epoch": 29.0,
	"eval_accuracy": 0.8397626112759644,
	"eval_loss": 0.40831413865089417,
	"eval_runtime": 4.5637,
	"eval_samples_per_second": 73.843,
	"eval_steps_per_second": 9.422,
	"step": 464
	},
	{
	"epoch": 30.0,
	"eval_accuracy": 0.8397626112759644,
	"eval_loss": 0.40189576148986816,
	"eval_runtime": 4.6019,
	"eval_samples_per_second": 73.23,
	"eval_steps_per_second": 9.344,
	"step": 480
	},
	{
	"epoch": 31.0,
	"eval_accuracy": 0.8427299703264095,
	"eval_loss": 0.39464861154556274,
	"eval_runtime": 4.5459,
	"eval_samples_per_second": 74.133,
	"eval_steps_per_second": 9.459,
	"step": 496
	},
	{
	"epoch": 31.25,
	"grad_norm": 2.8177223205566406,
	"learning_rate": 8.098055790363483e-07,
	"loss": 0.7287,
	"step": 500
	},
	{
	"epoch": 32.0,
	"eval_accuracy": 0.8427299703264095,
	"eval_loss": 0.38916730880737305,
	"eval_runtime": 4.6237,
	"eval_samples_per_second": 72.886,
	"eval_steps_per_second": 9.3,
	"step": 512
	},
	{
	"epoch": 33.0,
	"eval_accuracy": 0.8516320474777448,
	"eval_loss": 0.3844282031059265,
	"eval_runtime": 4.5824,
	"eval_samples_per_second": 73.542,
	"eval_steps_per_second": 9.384,
	"step": 528
	},
	{
	"epoch": 34.0,
	"eval_accuracy": 0.8516320474777448,
	"eval_loss": 0.37861311435699463,
	"eval_runtime": 4.5644,
	"eval_samples_per_second": 73.833,
	"eval_steps_per_second": 9.421,
	"step": 544
	},
	{
	"epoch": 35.0,
	"eval_accuracy": 0.8516320474777448,
	"eval_loss": 0.3732515275478363,
	"eval_runtime": 4.5962,
	"eval_samples_per_second": 73.322,
	"eval_steps_per_second": 9.356,
	"step": 560
	},
	{
	"epoch": 36.0,
	"eval_accuracy": 0.8516320474777448,
	"eval_loss": 0.37023723125457764,
	"eval_runtime": 4.5345,
	"eval_samples_per_second": 74.319,
	"eval_steps_per_second": 9.483,
	"step": 576
	},
	{
	"epoch": 37.0,
	"eval_accuracy": 0.8605341246290801,
	"eval_loss": 0.36356887221336365,
	"eval_runtime": 4.6253,
	"eval_samples_per_second": 72.86,
	"eval_steps_per_second": 9.297,
	"step": 592
	},
	{
	"epoch": 38.0,
	"eval_accuracy": 0.8635014836795252,
	"eval_loss": 0.35962143540382385,
	"eval_runtime": 4.5862,
	"eval_samples_per_second": 73.482,
	"eval_steps_per_second": 9.376,
	"step": 608
	},
	{
	"epoch": 39.0,
	"eval_accuracy": 0.8605341246290801,
	"eval_loss": 0.3568034768104553,
	"eval_runtime": 4.5393,
	"eval_samples_per_second": 74.241,
	"eval_steps_per_second": 9.473,
	"step": 624
	},
	{
	"epoch": 40.0,
	"eval_accuracy": 0.8516320474777448,
	"eval_loss": 0.35836362838745117,
	"eval_runtime": 4.5145,
	"eval_samples_per_second": 74.649,
	"eval_steps_per_second": 9.525,
	"step": 640
	},
	{
	"epoch": 41.0,
	"eval_accuracy": 0.857566765578635,
	"eval_loss": 0.35482144355773926,
	"eval_runtime": 4.5734,
	"eval_samples_per_second": 73.687,
	"eval_steps_per_second": 9.402,
	"step": 656
	},
	{
	"epoch": 42.0,
	"eval_accuracy": 0.857566765578635,
	"eval_loss": 0.3515448272228241,
	"eval_runtime": 4.5679,
	"eval_samples_per_second": 73.776,
	"eval_steps_per_second": 9.414,
	"step": 672
	},
	{
	"epoch": 43.0,
	"eval_accuracy": 0.8605341246290801,
	"eval_loss": 0.3470025658607483,
	"eval_runtime": 4.5874,
	"eval_samples_per_second": 73.462,
	"eval_steps_per_second": 9.374,
	"step": 688
	},
	{
	"epoch": 44.0,
	"eval_accuracy": 0.8664688427299704,
	"eval_loss": 0.3467743992805481,
	"eval_runtime": 4.6426,
	"eval_samples_per_second": 72.589,
	"eval_steps_per_second": 9.262,
	"step": 704
	},
	{
	"epoch": 45.0,
	"eval_accuracy": 0.8664688427299704,
	"eval_loss": 0.3463208079338074,
	"eval_runtime": 4.5833,
	"eval_samples_per_second": 73.528,
	"eval_steps_per_second": 9.382,
	"step": 720
	},
	{
	"epoch": 46.0,
	"eval_accuracy": 0.8664688427299704,
	"eval_loss": 0.3457556664943695,
	"eval_runtime": 4.6971,
	"eval_samples_per_second": 71.746,
	"eval_steps_per_second": 9.155,
	"step": 736
	},
	{
	"epoch": 47.0,
	"eval_accuracy": 0.8664688427299704,
	"eval_loss": 0.3446126878261566,
	"eval_runtime": 4.5645,
	"eval_samples_per_second": 73.831,
	"eval_steps_per_second": 9.421,
	"step": 752
	},
	{
	"epoch": 48.0,
	"eval_accuracy": 0.8664688427299704,
	"eval_loss": 0.34248268604278564,
	"eval_runtime": 4.5812,
	"eval_samples_per_second": 73.561,
	"eval_steps_per_second": 9.386,
	"step": 768
	},
	{
	"epoch": 49.0,
	"eval_accuracy": 0.8694362017804155,
	"eval_loss": 0.3440556824207306,
	"eval_runtime": 4.5663,
	"eval_samples_per_second": 73.802,
	"eval_steps_per_second": 9.417,
	"step": 784
	},
	{
	"epoch": 50.0,
	"eval_accuracy": 0.8664688427299704,
	"eval_loss": 0.3455652594566345,
	"eval_runtime": 4.5263,
	"eval_samples_per_second": 74.454,
	"eval_steps_per_second": 9.5,
	"step": 800
	},
	{
	"epoch": 51.0,
	"eval_accuracy": 0.8724035608308606,
	"eval_loss": 0.3401181697845459,
	"eval_runtime": 4.5842,
	"eval_samples_per_second": 73.513,
	"eval_steps_per_second": 9.38,
	"step": 816
	},
	{
	"epoch": 52.0,
	"eval_accuracy": 0.8724035608308606,
	"eval_loss": 0.33749544620513916,
	"eval_runtime": 4.5545,
	"eval_samples_per_second": 73.993,
	"eval_steps_per_second": 9.441,
	"step": 832
	},
	{
	"epoch": 53.0,
	"eval_accuracy": 0.8724035608308606,
	"eval_loss": 0.33886510133743286,
	"eval_runtime": 4.6181,
	"eval_samples_per_second": 72.974,
	"eval_steps_per_second": 9.311,
	"step": 848
	},
	{
	"epoch": 54.0,
	"eval_accuracy": 0.8724035608308606,
	"eval_loss": 0.33066779375076294,
	"eval_runtime": 4.6066,
	"eval_samples_per_second": 73.155,
	"eval_steps_per_second": 9.334,
	"step": 864
	},
	{
	"epoch": 55.0,
	"eval_accuracy": 0.8724035608308606,
	"eval_loss": 0.3285369575023651,
	"eval_runtime": 4.6615,
	"eval_samples_per_second": 72.294,
	"eval_steps_per_second": 9.224,
	"step": 880
	},
	{
	"epoch": 56.0,
	"eval_accuracy": 0.8724035608308606,
	"eval_loss": 0.3319447338581085,
	"eval_runtime": 4.6422,
	"eval_samples_per_second": 72.594,
	"eval_steps_per_second": 9.263,
	"step": 896
	},
	{
	"epoch": 57.0,
	"eval_accuracy": 0.8724035608308606,
	"eval_loss": 0.33194291591644287,
	"eval_runtime": 4.5847,
	"eval_samples_per_second": 73.506,
	"eval_steps_per_second": 9.379,
	"step": 912
	},
	{
	"epoch": 58.0,
	"eval_accuracy": 0.8724035608308606,
	"eval_loss": 0.33001473546028137,
	"eval_runtime": 4.546,
	"eval_samples_per_second": 74.131,
	"eval_steps_per_second": 9.459,
	"step": 928
	},
	{
	"epoch": 59.0,
	"eval_accuracy": 0.8753709198813057,
	"eval_loss": 0.32828956842422485,
	"eval_runtime": 4.5976,
	"eval_samples_per_second": 73.299,
	"eval_steps_per_second": 9.353,
	"step": 944
	},
	{
	"epoch": 60.0,
	"eval_accuracy": 0.8753709198813057,
	"eval_loss": 0.3273901641368866,
	"eval_runtime": 4.6205,
	"eval_samples_per_second": 72.936,
	"eval_steps_per_second": 9.306,
	"step": 960
	},
	{
	"epoch": 61.0,
	"eval_accuracy": 0.8753709198813057,
	"eval_loss": 0.32634109258651733,
	"eval_runtime": 4.5578,
	"eval_samples_per_second": 73.94,
	"eval_steps_per_second": 9.434,
	"step": 976
	},
	{
	"epoch": 62.0,
	"eval_accuracy": 0.8753709198813057,
	"eval_loss": 0.3289165496826172,
	"eval_runtime": 4.6025,
	"eval_samples_per_second": 73.22,
	"eval_steps_per_second": 9.343,
	"step": 992
	},
	{
	"epoch": 62.5,
	"grad_norm": 2.3223371505737305,
	"learning_rate": 5.984784446322908e-07,
	"loss": 0.2023,
	"step": 1000
	},
	{
	"epoch": 63.0,
	"eval_accuracy": 0.8783382789317508,
	"eval_loss": 0.3229311406612396,
	"eval_runtime": 4.5765,
	"eval_samples_per_second": 73.637,
	"eval_steps_per_second": 9.396,
	"step": 1008
	}
	],
	"logging_steps": 500,
	"max_steps": 2416,
	"num_input_tokens_seen": 0,
	"num_train_epochs": 151,
	"save_steps": 500,
	"total_flos": 2.4654076495882445e+18,
	"train_batch_size": 32,
	"trial_name": null,
	"trial_params": null
	}