PlutoG99001 commited on
Commit
a3785c1
·
verified ·
1 Parent(s): a3d5ae1

End of training

Browse files
Files changed (2) hide show
  1. README.md +3 -1
  2. trainer_state.json +125 -83
README.md CHANGED
@@ -3,6 +3,8 @@ base_model: facebook/musicgen-melody
3
  library_name: peft
4
  license: cc-by-nc-4.0
5
  tags:
 
 
6
  - generated_from_trainer
7
  model-index:
8
  - name: Piano-Model
@@ -14,7 +16,7 @@ should probably proofread and complete it, then remove this comment. -->
14
 
15
  # Piano-Model
16
 
17
- This model is a fine-tuned version of [facebook/musicgen-melody](https://huggingface.co/facebook/musicgen-melody) on an unknown dataset.
18
 
19
  ## Model description
20
 
 
3
  library_name: peft
4
  license: cc-by-nc-4.0
5
  tags:
6
+ - text-to-audio
7
+ - Piano
8
  - generated_from_trainer
9
  model-index:
10
  - name: Piano-Model
 
16
 
17
  # Piano-Model
18
 
19
+ This model is a fine-tuned version of [facebook/musicgen-melody](https://huggingface.co/facebook/musicgen-melody) on the PlutoG99001/Piano-clean dataset.
20
 
21
  ## Model description
22
 
trainer_state.json CHANGED
@@ -1,151 +1,193 @@
1
  {
2
  "best_metric": null,
3
  "best_model_checkpoint": null,
4
- "epoch": 3.6923076923076925,
5
  "eval_steps": 500,
6
- "global_step": 36,
7
  "is_hyper_param_search": false,
8
  "is_local_process_zero": true,
9
  "is_world_process_zero": true,
10
  "log_history": [
11
  {
12
- "epoch": 0.20512820512820512,
13
- "grad_norm": 3.4090847969055176,
14
- "learning_rate": 0.00018888888888888888,
15
- "loss": 8.6815,
16
  "step": 2
17
  },
18
  {
19
- "epoch": 0.41025641025641024,
20
- "grad_norm": 3.7809109687805176,
21
- "learning_rate": 0.00017777777777777779,
22
- "loss": 8.2204,
23
  "step": 4
24
  },
25
  {
26
- "epoch": 0.6153846153846154,
27
- "grad_norm": 5.441247463226318,
28
- "learning_rate": 0.0001666666666666667,
29
- "loss": 7.2478,
30
  "step": 6
31
  },
32
  {
33
- "epoch": 0.8205128205128205,
34
- "grad_norm": 3.1511142253875732,
35
- "learning_rate": 0.00015555555555555556,
36
- "loss": 6.0805,
37
  "step": 8
38
  },
39
  {
40
- "epoch": 1.0256410256410255,
41
- "grad_norm": 3.6586670875549316,
42
- "learning_rate": 0.00014444444444444444,
43
- "loss": 5.8499,
44
  "step": 10
45
  },
46
  {
47
- "epoch": 1.2307692307692308,
48
- "grad_norm": 3.667562961578369,
49
- "learning_rate": 0.00013333333333333334,
50
- "loss": 5.6406,
51
  "step": 12
52
  },
53
  {
54
- "epoch": 1.435897435897436,
55
- "grad_norm": 4.54071044921875,
56
- "learning_rate": 0.00012222222222222224,
57
- "loss": 4.7872,
58
  "step": 14
59
  },
60
  {
61
- "epoch": 1.641025641025641,
62
- "grad_norm": 4.788601875305176,
63
- "learning_rate": 0.00011111111111111112,
64
- "loss": 6.0102,
65
  "step": 16
66
  },
67
  {
68
- "epoch": 1.8461538461538463,
69
- "grad_norm": 2.731595516204834,
70
- "learning_rate": 0.0001,
71
- "loss": 5.3443,
72
  "step": 18
73
  },
74
  {
75
- "epoch": 2.051282051282051,
76
- "grad_norm": 2.9969563484191895,
77
- "learning_rate": 8.888888888888889e-05,
78
- "loss": 5.0464,
79
  "step": 20
80
  },
81
  {
82
- "epoch": 2.2564102564102564,
83
- "grad_norm": 2.7965035438537598,
84
- "learning_rate": 7.777777777777778e-05,
85
- "loss": 5.0523,
86
  "step": 22
87
  },
88
  {
89
- "epoch": 2.4615384615384617,
90
- "grad_norm": 2.5996360778808594,
91
- "learning_rate": 6.666666666666667e-05,
92
- "loss": 5.1417,
93
  "step": 24
94
  },
95
  {
96
- "epoch": 2.6666666666666665,
97
- "grad_norm": 2.2516720294952393,
98
- "learning_rate": 5.555555555555556e-05,
99
- "loss": 4.571,
100
  "step": 26
101
  },
102
  {
103
- "epoch": 2.871794871794872,
104
- "grad_norm": 3.5645246505737305,
105
- "learning_rate": 4.4444444444444447e-05,
106
- "loss": 4.9004,
107
  "step": 28
108
  },
109
  {
110
- "epoch": 3.076923076923077,
111
- "grad_norm": 1.808791995048523,
112
- "learning_rate": 3.3333333333333335e-05,
113
- "loss": 4.6747,
114
  "step": 30
115
  },
116
  {
117
- "epoch": 3.282051282051282,
118
- "grad_norm": 2.8537707328796387,
119
- "learning_rate": 2.2222222222222223e-05,
120
- "loss": 3.9459,
121
  "step": 32
122
  },
123
  {
124
- "epoch": 3.4871794871794872,
125
- "grad_norm": 3.786196708679199,
126
- "learning_rate": 1.1111111111111112e-05,
127
- "loss": 5.4513,
128
  "step": 34
129
  },
130
  {
131
- "epoch": 3.6923076923076925,
132
- "grad_norm": 0.8137506246566772,
133
- "learning_rate": 0.0,
134
- "loss": 4.9191,
135
  "step": 36
136
  },
137
  {
138
- "epoch": 3.6923076923076925,
139
- "step": 36,
140
- "total_flos": 73188581212248.0,
141
- "train_loss": 5.642510652542114,
142
- "train_runtime": 91.2089,
143
- "train_samples_per_second": 3.421,
144
- "train_steps_per_second": 0.395
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
145
  }
146
  ],
147
  "logging_steps": 2,
148
- "max_steps": 36,
149
  "num_input_tokens_seen": 0,
150
  "num_train_epochs": 4,
151
  "save_steps": 500,
@@ -161,7 +203,7 @@
161
  "attributes": {}
162
  }
163
  },
164
- "total_flos": 73188581212248.0,
165
  "train_batch_size": 2,
166
  "trial_name": null,
167
  "trial_params": null
 
1
  {
2
  "best_metric": null,
3
  "best_model_checkpoint": null,
4
+ "epoch": 4.0,
5
  "eval_steps": 500,
6
+ "global_step": 48,
7
  "is_hyper_param_search": false,
8
  "is_local_process_zero": true,
9
  "is_world_process_zero": true,
10
  "log_history": [
11
  {
12
+ "epoch": 0.16666666666666666,
13
+ "grad_norm": 2.3739163875579834,
14
+ "learning_rate": 0.00019166666666666667,
15
+ "loss": 9.3039,
16
  "step": 2
17
  },
18
  {
19
+ "epoch": 0.3333333333333333,
20
+ "grad_norm": 3.9307541847229004,
21
+ "learning_rate": 0.00018333333333333334,
22
+ "loss": 8.3844,
23
  "step": 4
24
  },
25
  {
26
+ "epoch": 0.5,
27
+ "grad_norm": 5.566093444824219,
28
+ "learning_rate": 0.000175,
29
+ "loss": 8.1736,
30
  "step": 6
31
  },
32
  {
33
+ "epoch": 0.6666666666666666,
34
+ "grad_norm": 2.880260467529297,
35
+ "learning_rate": 0.0001666666666666667,
36
+ "loss": 6.9991,
37
  "step": 8
38
  },
39
  {
40
+ "epoch": 0.8333333333333334,
41
+ "grad_norm": 2.4592766761779785,
42
+ "learning_rate": 0.00015833333333333332,
43
+ "loss": 6.751,
44
  "step": 10
45
  },
46
  {
47
+ "epoch": 1.0,
48
+ "grad_norm": 1.968120813369751,
49
+ "learning_rate": 0.00015000000000000001,
50
+ "loss": 6.6477,
51
  "step": 12
52
  },
53
  {
54
+ "epoch": 1.1666666666666667,
55
+ "grad_norm": 1.9354348182678223,
56
+ "learning_rate": 0.00014166666666666668,
57
+ "loss": 6.4832,
58
  "step": 14
59
  },
60
  {
61
+ "epoch": 1.3333333333333333,
62
+ "grad_norm": 1.6359012126922607,
63
+ "learning_rate": 0.00013333333333333334,
64
+ "loss": 5.8724,
65
  "step": 16
66
  },
67
  {
68
+ "epoch": 1.5,
69
+ "grad_norm": 1.5894787311553955,
70
+ "learning_rate": 0.000125,
71
+ "loss": 5.6969,
72
  "step": 18
73
  },
74
  {
75
+ "epoch": 1.6666666666666665,
76
+ "grad_norm": 1.2109304666519165,
77
+ "learning_rate": 0.00011666666666666668,
78
+ "loss": 5.5345,
79
  "step": 20
80
  },
81
  {
82
+ "epoch": 1.8333333333333335,
83
+ "grad_norm": 2.348996639251709,
84
+ "learning_rate": 0.00010833333333333333,
85
+ "loss": 6.058,
86
  "step": 22
87
  },
88
  {
89
+ "epoch": 2.0,
90
+ "grad_norm": 1.2399171590805054,
91
+ "learning_rate": 0.0001,
92
+ "loss": 5.5483,
93
  "step": 24
94
  },
95
  {
96
+ "epoch": 2.1666666666666665,
97
+ "grad_norm": 0.9040967226028442,
98
+ "learning_rate": 9.166666666666667e-05,
99
+ "loss": 5.1483,
100
  "step": 26
101
  },
102
  {
103
+ "epoch": 2.3333333333333335,
104
+ "grad_norm": 2.2436225414276123,
105
+ "learning_rate": 8.333333333333334e-05,
106
+ "loss": 6.0503,
107
  "step": 28
108
  },
109
  {
110
+ "epoch": 2.5,
111
+ "grad_norm": 0.7689768075942993,
112
+ "learning_rate": 7.500000000000001e-05,
113
+ "loss": 5.6709,
114
  "step": 30
115
  },
116
  {
117
+ "epoch": 2.6666666666666665,
118
+ "grad_norm": 0.7024766802787781,
119
+ "learning_rate": 6.666666666666667e-05,
120
+ "loss": 5.8907,
121
  "step": 32
122
  },
123
  {
124
+ "epoch": 2.8333333333333335,
125
+ "grad_norm": 0.8444733023643494,
126
+ "learning_rate": 5.833333333333334e-05,
127
+ "loss": 5.5514,
128
  "step": 34
129
  },
130
  {
131
+ "epoch": 3.0,
132
+ "grad_norm": 0.8129612803459167,
133
+ "learning_rate": 5e-05,
134
+ "loss": 5.6258,
135
  "step": 36
136
  },
137
  {
138
+ "epoch": 3.1666666666666665,
139
+ "grad_norm": 1.3147270679473877,
140
+ "learning_rate": 4.166666666666667e-05,
141
+ "loss": 5.7991,
142
+ "step": 38
143
+ },
144
+ {
145
+ "epoch": 3.3333333333333335,
146
+ "grad_norm": 0.7770213484764099,
147
+ "learning_rate": 3.3333333333333335e-05,
148
+ "loss": 5.6323,
149
+ "step": 40
150
+ },
151
+ {
152
+ "epoch": 3.5,
153
+ "grad_norm": 1.0144660472869873,
154
+ "learning_rate": 2.5e-05,
155
+ "loss": 5.84,
156
+ "step": 42
157
+ },
158
+ {
159
+ "epoch": 3.6666666666666665,
160
+ "grad_norm": 0.7552654147148132,
161
+ "learning_rate": 1.6666666666666667e-05,
162
+ "loss": 5.4281,
163
+ "step": 44
164
+ },
165
+ {
166
+ "epoch": 3.8333333333333335,
167
+ "grad_norm": 1.1203110218048096,
168
+ "learning_rate": 8.333333333333334e-06,
169
+ "loss": 5.5833,
170
+ "step": 46
171
+ },
172
+ {
173
+ "epoch": 4.0,
174
+ "grad_norm": 1.0069904327392578,
175
+ "learning_rate": 0.0,
176
+ "loss": 5.5044,
177
+ "step": 48
178
+ },
179
+ {
180
+ "epoch": 4.0,
181
+ "step": 48,
182
+ "total_flos": 119132385096180.0,
183
+ "train_loss": 6.215731521447499,
184
+ "train_runtime": 120.3352,
185
+ "train_samples_per_second": 3.158,
186
+ "train_steps_per_second": 0.399
187
  }
188
  ],
189
  "logging_steps": 2,
190
+ "max_steps": 48,
191
  "num_input_tokens_seen": 0,
192
  "num_train_epochs": 4,
193
  "save_steps": 500,
 
203
  "attributes": {}
204
  }
205
  },
206
+ "total_flos": 119132385096180.0,
207
  "train_batch_size": 2,
208
  "trial_name": null,
209
  "trial_params": null