KLUE-custom-ner / train.log

Upload 9 files

942f464 verified 6 months ago

3.86 kB

	['run_entity.py', '--do_train', '--do_eval', '--eval_test', '--learning_rate=1e-5', '--task_learning_rate=5e-4', '--train_batch_size=32', '--context_window', '0', '--task', 'ko', '--data_dir', 'sh_aug+klue', '--model', 'monologg/kobert', '--output_dir', 'sh_aug+klue_dir']
	Namespace(bert_model_dir=None, bertadam=False, context_window=0, data_dir='sh_aug+klue', dev_data='sh_aug+klue\\dev.json', dev_pred_filename='ent_pred_dev.json', do_eval=True, do_train=True, eval_batch_size=32, eval_per_epoch=1, eval_test=True, learning_rate=1e-05, max_span_length=8, model='monologg/kobert', num_epoch=20, output_dir='sh_aug+klue_dir', print_loss_step=100, seed=0, task='ko', task_learning_rate=0.0005, test_data='sh_aug+klue\\test.json', test_pred_filename='ent_pred_test.json', train_batch_size=32, train_data='sh_aug+klue\\train.json', train_shuffle=False, use_albert=False, warmup_proportion=0.1)
	Moving to CUDA...
	# GPUs = 1
	# Overlap: 0
	Extracted 5574 samples from 5574 documents, with 16074 NER labels, 30.600 avg input length, 93 max length
	Max Length: 93, max NER: 16
	# Overlap: 0
	Extracted 22849 samples from 22849 documents, with 57142 NER labels, 28.977 avg input length, 111 max length
	Max Length: 111, max NER: 23
	Epoch=0, iter=99, loss=382.98039
	Epoch=0, iter=199, loss=92.19124
	Epoch=0, iter=299, loss=18.17063
	Epoch=0, iter=399, loss=17.86108
	Epoch=0, iter=499, loss=17.41379
	Epoch=0, iter=599, loss=17.11055
	Epoch=0, iter=699, loss=14.89083
	Evaluating...
	Accuracy: 0.986949
	Cor: 0, Pred TOT: 0, Gold TOT: 16074
	P: 0.00000, R: 0.00000, F1: 0.00000
	Used time: 43.244831
	Epoch=1, iter=84, loss=12.58960
	Epoch=1, iter=184, loss=10.30858
	Epoch=1, iter=284, loss=8.34273
	Epoch=1, iter=384, loss=6.43022
	Epoch=1, iter=484, loss=5.32054
	Epoch=1, iter=584, loss=4.63362
	Epoch=1, iter=684, loss=4.06674
	Evaluating...
	Accuracy: 0.994374
	Cor: 11197, Pred TOT: 13860, Gold TOT: 16074
	P: 0.80786, R: 0.69659, F1: 0.74811
	Used time: 44.417693
	!!! Best valid (epoch=1): 74.81
	Saving model to sh_aug+klue_dir...
	Epoch=2, iter=69, loss=3.59020
	Epoch=2, iter=169, loss=3.38379
	Epoch=2, iter=269, loss=3.14521
	Epoch=2, iter=369, loss=2.92039
	Epoch=2, iter=469, loss=2.76133
	Epoch=2, iter=569, loss=2.57549
	Epoch=2, iter=669, loss=2.55223
	Evaluating...
	Accuracy: 0.995934
	Cor: 13018, Pred TOT: 15461, Gold TOT: 16074
	P: 0.84199, R: 0.80988, F1: 0.82562
	Used time: 40.365823
	!!! Best valid (epoch=2): 82.56
	Saving model to sh_aug+klue_dir...
	Epoch=3, iter=54, loss=2.32016
	Epoch=3, iter=154, loss=2.18908
	Epoch=3, iter=254, loss=2.26152
	Epoch=3, iter=354, loss=2.06879
	Epoch=3, iter=454, loss=2.03323
	Epoch=3, iter=554, loss=1.93354
	Epoch=3, iter=654, loss=1.86967
	Evaluating...
	Accuracy: 0.996433
	Cor: 13478, Pred TOT: 15757, Gold TOT: 16074
	P: 0.85537, R: 0.83850, F1: 0.84685
	Used time: 41.699907
	!!! Best valid (epoch=3): 84.68
	Saving model to sh_aug+klue_dir...
	Epoch=4, iter=39, loss=1.74192
	Epoch=4, iter=139, loss=1.66635
	Epoch=4, iter=239, loss=1.71463
	Epoch=4, iter=339, loss=1.59322
	Epoch=4, iter=439, loss=1.62414
	Epoch=4, iter=539, loss=1.52524
	Epoch=4, iter=639, loss=1.55066
	Evaluating...
	Accuracy: 0.996524
	Cor: 13755, Pred TOT: 16223, Gold TOT: 16074
	P: 0.84787, R: 0.85573, F1: 0.85178
	Used time: 40.325464
	!!! Best valid (epoch=4): 85.18
	Saving model to sh_aug+klue_dir...
	Epoch=5, iter=24, loss=1.37847
	Epoch=5, iter=124, loss=1.37336
	Epoch=5, iter=224, loss=1.39704
	Epoch=5, iter=324, loss=1.28449
	Epoch=5, iter=424, loss=1.41600
	Epoch=5, iter=524, loss=1.20445
	Epoch=5, iter=624, loss=1.30613
	Evaluating...
	Accuracy: 0.996762
	Cor: 13890, Pred TOT: 16181, Gold TOT: 16074
	P: 0.85841, R: 0.86413, F1: 0.86126
	Used time: 67.691342
	!!! Best valid (epoch=5): 86.13
	Saving model to sh_aug+klue_dir...
	Epoch=6, iter=9, loss=1.21428
	Epoch=6, iter=109, loss=1.10397