honnlp commited on
Commit
c32eb11
1 Parent(s): 762d31f

End of training

Browse files
all_results.json CHANGED
@@ -1,8 +1,8 @@
1
  {
2
  "epoch": 3.25,
3
- "eval_accuracy": 0.7677419354838709,
4
- "eval_loss": 0.5838326811790466,
5
- "eval_runtime": 30.1878,
6
- "eval_samples_per_second": 5.135,
7
- "eval_steps_per_second": 1.292
8
  }
 
1
  {
2
  "epoch": 3.25,
3
+ "eval_accuracy": 0.9225806451612903,
4
+ "eval_loss": 0.30445486307144165,
5
+ "eval_runtime": 29.6038,
6
+ "eval_samples_per_second": 5.236,
7
+ "eval_steps_per_second": 1.317
8
  }
runs/May12_18-11-57_gcp/events.out.tfevents.1715538234.gcp.1903.1 CHANGED
@@ -1,3 +1,3 @@
1
  version https://git-lfs.github.com/spec/v1
2
- oid sha256:a08856973faf170e6a22240d6c0b2f1ab41b6e78dd87851ec5f789df1298d44e
3
- size 411
 
1
  version https://git-lfs.github.com/spec/v1
2
+ oid sha256:bff98acb5efd169c6c71d9516f4f608d6c67d67935d9504cea2f5b4ea976306d
3
+ size 734
test_results.json CHANGED
@@ -1,8 +1,8 @@
1
  {
2
  "epoch": 3.25,
3
- "eval_accuracy": 0.7677419354838709,
4
- "eval_loss": 0.5838326811790466,
5
- "eval_runtime": 30.1878,
6
- "eval_samples_per_second": 5.135,
7
- "eval_steps_per_second": 1.292
8
  }
 
1
  {
2
  "epoch": 3.25,
3
+ "eval_accuracy": 0.9225806451612903,
4
+ "eval_loss": 0.30445486307144165,
5
+ "eval_runtime": 29.6038,
6
+ "eval_samples_per_second": 5.236,
7
+ "eval_steps_per_second": 1.317
8
  }
trainer_state.json CHANGED
@@ -1,6 +1,6 @@
1
  {
2
- "best_metric": 0.8428571428571429,
3
- "best_model_checkpoint": "videomae-base-finetuned-ucf101-subset/checkpoint-150",
4
  "epoch": 3.25,
5
  "eval_steps": 500,
6
  "global_step": 300,
@@ -10,275 +10,275 @@
10
  "log_history": [
11
  {
12
  "epoch": 0.03333333333333333,
13
- "grad_norm": 9.030272483825684,
14
  "learning_rate": 1.6666666666666667e-05,
15
- "loss": 2.3471,
16
  "step": 10
17
  },
18
  {
19
  "epoch": 0.06666666666666667,
20
- "grad_norm": 9.653508186340332,
21
  "learning_rate": 3.3333333333333335e-05,
22
- "loss": 2.2728,
23
  "step": 20
24
  },
25
  {
26
  "epoch": 0.1,
27
- "grad_norm": 9.514510154724121,
28
  "learning_rate": 5e-05,
29
- "loss": 2.2423,
30
  "step": 30
31
  },
32
  {
33
  "epoch": 0.13333333333333333,
34
- "grad_norm": 9.425768852233887,
35
  "learning_rate": 4.814814814814815e-05,
36
- "loss": 2.0797,
37
  "step": 40
38
  },
39
  {
40
  "epoch": 0.16666666666666666,
41
- "grad_norm": 12.643138885498047,
42
  "learning_rate": 4.62962962962963e-05,
43
- "loss": 2.1012,
44
  "step": 50
45
  },
46
  {
47
  "epoch": 0.2,
48
- "grad_norm": 9.729035377502441,
49
  "learning_rate": 4.4444444444444447e-05,
50
- "loss": 1.7497,
51
  "step": 60
52
  },
53
  {
54
  "epoch": 0.23333333333333334,
55
- "grad_norm": 9.487822532653809,
56
  "learning_rate": 4.259259259259259e-05,
57
- "loss": 1.7455,
58
  "step": 70
59
  },
60
  {
61
  "epoch": 0.25,
62
- "eval_accuracy": 0.5857142857142857,
63
- "eval_loss": 1.3021408319473267,
64
- "eval_runtime": 16.6801,
65
- "eval_samples_per_second": 4.197,
66
- "eval_steps_per_second": 1.079,
67
  "step": 75
68
  },
69
  {
70
  "epoch": 1.0166666666666666,
71
- "grad_norm": 9.826342582702637,
72
  "learning_rate": 4.074074074074074e-05,
73
- "loss": 1.3037,
74
  "step": 80
75
  },
76
  {
77
  "epoch": 1.05,
78
- "grad_norm": 10.802420616149902,
79
  "learning_rate": 3.888888888888889e-05,
80
- "loss": 1.128,
81
  "step": 90
82
  },
83
  {
84
  "epoch": 1.0833333333333333,
85
- "grad_norm": 15.328178405761719,
86
  "learning_rate": 3.7037037037037037e-05,
87
- "loss": 1.1334,
88
  "step": 100
89
  },
90
  {
91
  "epoch": 1.1166666666666667,
92
- "grad_norm": 9.453879356384277,
93
  "learning_rate": 3.518518518518519e-05,
94
- "loss": 0.8507,
95
  "step": 110
96
  },
97
  {
98
  "epoch": 1.15,
99
- "grad_norm": 10.099981307983398,
100
  "learning_rate": 3.3333333333333335e-05,
101
- "loss": 0.8617,
102
  "step": 120
103
  },
104
  {
105
  "epoch": 1.1833333333333333,
106
- "grad_norm": 21.905996322631836,
107
  "learning_rate": 3.148148148148148e-05,
108
- "loss": 0.6073,
109
  "step": 130
110
  },
111
  {
112
  "epoch": 1.2166666666666668,
113
- "grad_norm": 8.017053604125977,
114
  "learning_rate": 2.962962962962963e-05,
115
- "loss": 0.4951,
116
  "step": 140
117
  },
118
  {
119
  "epoch": 1.25,
120
- "grad_norm": 3.5494937896728516,
121
  "learning_rate": 2.777777777777778e-05,
122
- "loss": 0.9476,
123
  "step": 150
124
  },
125
  {
126
  "epoch": 1.25,
127
- "eval_accuracy": 0.8428571428571429,
128
- "eval_loss": 0.5081102252006531,
129
- "eval_runtime": 16.5404,
130
- "eval_samples_per_second": 4.232,
131
- "eval_steps_per_second": 1.088,
132
  "step": 150
133
  },
134
  {
135
  "epoch": 2.033333333333333,
136
- "grad_norm": 11.868717193603516,
137
  "learning_rate": 2.5925925925925925e-05,
138
- "loss": 0.2692,
139
  "step": 160
140
  },
141
  {
142
  "epoch": 2.066666666666667,
143
- "grad_norm": 11.16838550567627,
144
  "learning_rate": 2.4074074074074074e-05,
145
- "loss": 0.4435,
146
  "step": 170
147
  },
148
  {
149
  "epoch": 2.1,
150
- "grad_norm": 4.307368755340576,
151
  "learning_rate": 2.2222222222222223e-05,
152
- "loss": 0.3437,
153
  "step": 180
154
  },
155
  {
156
  "epoch": 2.1333333333333333,
157
- "grad_norm": 14.703262329101562,
158
  "learning_rate": 2.037037037037037e-05,
159
- "loss": 0.4501,
160
  "step": 190
161
  },
162
  {
163
  "epoch": 2.1666666666666665,
164
- "grad_norm": 3.9073095321655273,
165
  "learning_rate": 1.8518518518518518e-05,
166
- "loss": 0.3173,
167
  "step": 200
168
  },
169
  {
170
  "epoch": 2.2,
171
- "grad_norm": 7.474828720092773,
172
  "learning_rate": 1.6666666666666667e-05,
173
- "loss": 0.1711,
174
  "step": 210
175
  },
176
  {
177
  "epoch": 2.2333333333333334,
178
- "grad_norm": 1.4244682788848877,
179
  "learning_rate": 1.4814814814814815e-05,
180
- "loss": 0.3926,
181
  "step": 220
182
  },
183
  {
184
  "epoch": 2.25,
185
- "eval_accuracy": 0.7714285714285715,
186
- "eval_loss": 0.38518500328063965,
187
- "eval_runtime": 16.889,
188
- "eval_samples_per_second": 4.145,
189
- "eval_steps_per_second": 1.066,
190
  "step": 225
191
  },
192
  {
193
  "epoch": 3.0166666666666666,
194
- "grad_norm": 1.0246777534484863,
195
  "learning_rate": 1.2962962962962962e-05,
196
- "loss": 0.1841,
197
  "step": 230
198
  },
199
  {
200
  "epoch": 3.05,
201
- "grad_norm": 0.22415301203727722,
202
  "learning_rate": 1.1111111111111112e-05,
203
- "loss": 0.12,
204
  "step": 240
205
  },
206
  {
207
  "epoch": 3.0833333333333335,
208
- "grad_norm": 7.395457744598389,
209
  "learning_rate": 9.259259259259259e-06,
210
- "loss": 0.1242,
211
  "step": 250
212
  },
213
  {
214
  "epoch": 3.1166666666666667,
215
- "grad_norm": 0.42695850133895874,
216
  "learning_rate": 7.4074074074074075e-06,
217
- "loss": 0.1291,
218
  "step": 260
219
  },
220
  {
221
  "epoch": 3.15,
222
- "grad_norm": 2.703252077102661,
223
  "learning_rate": 5.555555555555556e-06,
224
- "loss": 0.1147,
225
  "step": 270
226
  },
227
  {
228
  "epoch": 3.183333333333333,
229
- "grad_norm": 0.6641141772270203,
230
  "learning_rate": 3.7037037037037037e-06,
231
- "loss": 0.2027,
232
  "step": 280
233
  },
234
  {
235
  "epoch": 3.216666666666667,
236
- "grad_norm": 1.9637229442596436,
237
  "learning_rate": 1.8518518518518519e-06,
238
- "loss": 0.2594,
239
  "step": 290
240
  },
241
  {
242
  "epoch": 3.25,
243
- "grad_norm": 0.8269719481468201,
244
  "learning_rate": 0.0,
245
- "loss": 0.2059,
246
  "step": 300
247
  },
248
  {
249
  "epoch": 3.25,
250
- "eval_accuracy": 0.8428571428571429,
251
- "eval_loss": 0.39890938997268677,
252
- "eval_runtime": 16.6405,
253
- "eval_samples_per_second": 4.207,
254
- "eval_steps_per_second": 1.082,
255
  "step": 300
256
  },
257
  {
258
  "epoch": 3.25,
259
  "step": 300,
260
  "total_flos": 1.495384188125184e+18,
261
- "train_loss": 0.8531251009305318,
262
- "train_runtime": 689.5393,
263
- "train_samples_per_second": 1.74,
264
- "train_steps_per_second": 0.435
265
  },
266
  {
267
  "epoch": 3.25,
268
- "eval_accuracy": 0.7677419354838709,
269
- "eval_loss": 0.5838326811790466,
270
- "eval_runtime": 31.2901,
271
- "eval_samples_per_second": 4.954,
272
- "eval_steps_per_second": 1.246,
273
  "step": 300
274
  },
275
  {
276
  "epoch": 3.25,
277
- "eval_accuracy": 0.7677419354838709,
278
- "eval_loss": 0.5838326811790466,
279
- "eval_runtime": 30.1878,
280
- "eval_samples_per_second": 5.135,
281
- "eval_steps_per_second": 1.292,
282
  "step": 300
283
  }
284
  ],
 
1
  {
2
+ "best_metric": 0.9,
3
+ "best_model_checkpoint": "videomae-base-finetuned-ucf101-subset/checkpoint-300",
4
  "epoch": 3.25,
5
  "eval_steps": 500,
6
  "global_step": 300,
 
10
  "log_history": [
11
  {
12
  "epoch": 0.03333333333333333,
13
+ "grad_norm": 9.796407699584961,
14
  "learning_rate": 1.6666666666666667e-05,
15
+ "loss": 2.2957,
16
  "step": 10
17
  },
18
  {
19
  "epoch": 0.06666666666666667,
20
+ "grad_norm": 9.56534194946289,
21
  "learning_rate": 3.3333333333333335e-05,
22
+ "loss": 2.2844,
23
  "step": 20
24
  },
25
  {
26
  "epoch": 0.1,
27
+ "grad_norm": 9.162632942199707,
28
  "learning_rate": 5e-05,
29
+ "loss": 2.1956,
30
  "step": 30
31
  },
32
  {
33
  "epoch": 0.13333333333333333,
34
+ "grad_norm": 9.857256889343262,
35
  "learning_rate": 4.814814814814815e-05,
36
+ "loss": 2.0529,
37
  "step": 40
38
  },
39
  {
40
  "epoch": 0.16666666666666666,
41
+ "grad_norm": 14.574447631835938,
42
  "learning_rate": 4.62962962962963e-05,
43
+ "loss": 2.0628,
44
  "step": 50
45
  },
46
  {
47
  "epoch": 0.2,
48
+ "grad_norm": 9.55310344696045,
49
  "learning_rate": 4.4444444444444447e-05,
50
+ "loss": 1.769,
51
  "step": 60
52
  },
53
  {
54
  "epoch": 0.23333333333333334,
55
+ "grad_norm": 12.72282600402832,
56
  "learning_rate": 4.259259259259259e-05,
57
+ "loss": 1.7867,
58
  "step": 70
59
  },
60
  {
61
  "epoch": 0.25,
62
+ "eval_accuracy": 0.5428571428571428,
63
+ "eval_loss": 1.3080873489379883,
64
+ "eval_runtime": 16.1891,
65
+ "eval_samples_per_second": 4.324,
66
+ "eval_steps_per_second": 1.112,
67
  "step": 75
68
  },
69
  {
70
  "epoch": 1.0166666666666666,
71
+ "grad_norm": 9.65126895904541,
72
  "learning_rate": 4.074074074074074e-05,
73
+ "loss": 1.2955,
74
  "step": 80
75
  },
76
  {
77
  "epoch": 1.05,
78
+ "grad_norm": 9.708106994628906,
79
  "learning_rate": 3.888888888888889e-05,
80
+ "loss": 0.9881,
81
  "step": 90
82
  },
83
  {
84
  "epoch": 1.0833333333333333,
85
+ "grad_norm": 13.812542915344238,
86
  "learning_rate": 3.7037037037037037e-05,
87
+ "loss": 1.0424,
88
  "step": 100
89
  },
90
  {
91
  "epoch": 1.1166666666666667,
92
+ "grad_norm": 10.680852890014648,
93
  "learning_rate": 3.518518518518519e-05,
94
+ "loss": 0.8059,
95
  "step": 110
96
  },
97
  {
98
  "epoch": 1.15,
99
+ "grad_norm": 8.754110336303711,
100
  "learning_rate": 3.3333333333333335e-05,
101
+ "loss": 0.7942,
102
  "step": 120
103
  },
104
  {
105
  "epoch": 1.1833333333333333,
106
+ "grad_norm": 12.191349029541016,
107
  "learning_rate": 3.148148148148148e-05,
108
+ "loss": 0.5023,
109
  "step": 130
110
  },
111
  {
112
  "epoch": 1.2166666666666668,
113
+ "grad_norm": 5.203872203826904,
114
  "learning_rate": 2.962962962962963e-05,
115
+ "loss": 0.4333,
116
  "step": 140
117
  },
118
  {
119
  "epoch": 1.25,
120
+ "grad_norm": 6.432222366333008,
121
  "learning_rate": 2.777777777777778e-05,
122
+ "loss": 0.7871,
123
  "step": 150
124
  },
125
  {
126
  "epoch": 1.25,
127
+ "eval_accuracy": 0.7857142857142857,
128
+ "eval_loss": 0.5381054282188416,
129
+ "eval_runtime": 16.23,
130
+ "eval_samples_per_second": 4.313,
131
+ "eval_steps_per_second": 1.109,
132
  "step": 150
133
  },
134
  {
135
  "epoch": 2.033333333333333,
136
+ "grad_norm": 5.675662517547607,
137
  "learning_rate": 2.5925925925925925e-05,
138
+ "loss": 0.3323,
139
  "step": 160
140
  },
141
  {
142
  "epoch": 2.066666666666667,
143
+ "grad_norm": 29.48726463317871,
144
  "learning_rate": 2.4074074074074074e-05,
145
+ "loss": 0.4221,
146
  "step": 170
147
  },
148
  {
149
  "epoch": 2.1,
150
+ "grad_norm": 5.2884907722473145,
151
  "learning_rate": 2.2222222222222223e-05,
152
+ "loss": 0.3494,
153
  "step": 180
154
  },
155
  {
156
  "epoch": 2.1333333333333333,
157
+ "grad_norm": 6.56082820892334,
158
  "learning_rate": 2.037037037037037e-05,
159
+ "loss": 0.3741,
160
  "step": 190
161
  },
162
  {
163
  "epoch": 2.1666666666666665,
164
+ "grad_norm": 3.4989917278289795,
165
  "learning_rate": 1.8518518518518518e-05,
166
+ "loss": 0.3709,
167
  "step": 200
168
  },
169
  {
170
  "epoch": 2.2,
171
+ "grad_norm": 2.7712182998657227,
172
  "learning_rate": 1.6666666666666667e-05,
173
+ "loss": 0.3153,
174
  "step": 210
175
  },
176
  {
177
  "epoch": 2.2333333333333334,
178
+ "grad_norm": 0.7842445373535156,
179
  "learning_rate": 1.4814814814814815e-05,
180
+ "loss": 0.2923,
181
  "step": 220
182
  },
183
  {
184
  "epoch": 2.25,
185
+ "eval_accuracy": 0.7571428571428571,
186
+ "eval_loss": 0.46805742383003235,
187
+ "eval_runtime": 16.1856,
188
+ "eval_samples_per_second": 4.325,
189
+ "eval_steps_per_second": 1.112,
190
  "step": 225
191
  },
192
  {
193
  "epoch": 3.0166666666666666,
194
+ "grad_norm": 1.3947151899337769,
195
  "learning_rate": 1.2962962962962962e-05,
196
+ "loss": 0.1865,
197
  "step": 230
198
  },
199
  {
200
  "epoch": 3.05,
201
+ "grad_norm": 0.3738820552825928,
202
  "learning_rate": 1.1111111111111112e-05,
203
+ "loss": 0.1203,
204
  "step": 240
205
  },
206
  {
207
  "epoch": 3.0833333333333335,
208
+ "grad_norm": 11.37885570526123,
209
  "learning_rate": 9.259259259259259e-06,
210
+ "loss": 0.1452,
211
  "step": 250
212
  },
213
  {
214
  "epoch": 3.1166666666666667,
215
+ "grad_norm": 0.6158033013343811,
216
  "learning_rate": 7.4074074074074075e-06,
217
+ "loss": 0.168,
218
  "step": 260
219
  },
220
  {
221
  "epoch": 3.15,
222
+ "grad_norm": 2.308946371078491,
223
  "learning_rate": 5.555555555555556e-06,
224
+ "loss": 0.1501,
225
  "step": 270
226
  },
227
  {
228
  "epoch": 3.183333333333333,
229
+ "grad_norm": 1.3887075185775757,
230
  "learning_rate": 3.7037037037037037e-06,
231
+ "loss": 0.1935,
232
  "step": 280
233
  },
234
  {
235
  "epoch": 3.216666666666667,
236
+ "grad_norm": 1.384949803352356,
237
  "learning_rate": 1.8518518518518519e-06,
238
+ "loss": 0.1793,
239
  "step": 290
240
  },
241
  {
242
  "epoch": 3.25,
243
+ "grad_norm": 0.7878948450088501,
244
  "learning_rate": 0.0,
245
+ "loss": 0.2033,
246
  "step": 300
247
  },
248
  {
249
  "epoch": 3.25,
250
+ "eval_accuracy": 0.9,
251
+ "eval_loss": 0.2786923944950104,
252
+ "eval_runtime": 16.2159,
253
+ "eval_samples_per_second": 4.317,
254
+ "eval_steps_per_second": 1.11,
255
  "step": 300
256
  },
257
  {
258
  "epoch": 3.25,
259
  "step": 300,
260
  "total_flos": 1.495384188125184e+18,
261
+ "train_loss": 0.8299423436323802,
262
+ "train_runtime": 668.5558,
263
+ "train_samples_per_second": 1.795,
264
+ "train_steps_per_second": 0.449
265
  },
266
  {
267
  "epoch": 3.25,
268
+ "eval_accuracy": 0.9225806451612903,
269
+ "eval_loss": 0.30445483326911926,
270
+ "eval_runtime": 30.85,
271
+ "eval_samples_per_second": 5.024,
272
+ "eval_steps_per_second": 1.264,
273
  "step": 300
274
  },
275
  {
276
  "epoch": 3.25,
277
+ "eval_accuracy": 0.9225806451612903,
278
+ "eval_loss": 0.30445486307144165,
279
+ "eval_runtime": 29.6038,
280
+ "eval_samples_per_second": 5.236,
281
+ "eval_steps_per_second": 1.317,
282
  "step": 300
283
  }
284
  ],