Training in progress, step 1000

Browse files

Files changed (4) hide show

config.json +6 -16
generation_config.json +1 -1
model.safetensors +2 -2
training_args.bin +1 -1

config.json CHANGED Viewed

@@ -46,7 +46,7 @@
       }
     },
     "audio_token_id": 59260,
-    "dtype": "bfloat16",
     "hidden_size": 2048,
     "model_type": "glmasr",
     "num_mel_bins": 128,
@@ -122,7 +122,7 @@
   },
   "do_sample": false,
   "downsample_rate": 5,
-  "dtype": "bfloat16",
   "encoder": {
     "_name_or_path": "zai-org/GLM-ASR-Nano-2512",
     "architectures": [
@@ -166,7 +166,7 @@
       }
     },
     "audio_token_id": 59260,
-    "dtype": "bfloat16",
     "hidden_size": 2048,
     "model_type": "glmasr",
     "num_mel_bins": 128,
@@ -237,9 +237,6 @@
   "eos_token_id": 151645,
   "freeze_language_model": false,
   "freeze_projector": false,
-  "freq_mask_length": 27,
-  "inference_warmup_tokens": 10,
-  "label_smoothing": 0.0,
   "length_penalty": 1.0,
   "llm_dim": 1024,
   "lora_alpha": 32,
@@ -254,23 +251,18 @@
     "up_proj",
     "down_proj"
   ],
-  "max_new_tokens": 128,
   "min_new_tokens": 0,
-  "model_dtype": "bfloat16",
   "model_type": "asr_model",
   "no_repeat_ngram_size": 0,
   "num_beams": 1,
   "num_experts": 4,
   "num_experts_per_tok": 2,
-  "num_freq_masks": 2,
-  "num_time_masks": 2,
   "pad_token_id": 151643,
   "pipeline_tag": "automatic-speech-recognition",
   "pretrained_model_path": "mazesmazes/tiny-audio-embedded",
-  "projector_dropout": 0.0,
   "projector_hidden_dim": 2048,
-  "projector_init_std": 0.02,
-  "projector_num_layers": 2,
   "projector_pool_stride": 4,
   "projector_type": "mlp",
   "qformer_hidden_size": null,
@@ -290,7 +282,7 @@
     "attention_bias": false,
     "attention_dropout": 0.0,
     "bos_token_id": null,
-    "dtype": "bfloat16",
     "eos_token_id": 151645,
     "head_dim": 128,
     "hidden_act": "silu",
@@ -346,12 +338,10 @@
     "vocab_size": 151670
   },
   "text_model_id": "Qwen/Qwen3-0.6B",
-  "time_mask_length": 100,
   "top_k": null,
   "top_p": null,
   "transformers_version": "5.6.1",
   "use_cache": false,
   "use_lora": false,
-  "use_specaugment": true,
   "vocab_size": 151670
 }

       }
     },
     "audio_token_id": 59260,
+    "dtype": "float32",
     "hidden_size": 2048,
     "model_type": "glmasr",
     "num_mel_bins": 128,
   },
   "do_sample": false,
   "downsample_rate": 5,
+  "dtype": "float32",
   "encoder": {
     "_name_or_path": "zai-org/GLM-ASR-Nano-2512",
     "architectures": [
       }
     },
     "audio_token_id": 59260,
+    "dtype": "float32",
     "hidden_size": 2048,
     "model_type": "glmasr",
     "num_mel_bins": 128,
   "eos_token_id": 151645,
   "freeze_language_model": false,
   "freeze_projector": false,
   "length_penalty": 1.0,
   "llm_dim": 1024,
   "lora_alpha": 32,
     "up_proj",
     "down_proj"
   ],
+  "max_new_tokens": 256,
   "min_new_tokens": 0,
+  "model_dtype": "float32",
   "model_type": "asr_model",
   "no_repeat_ngram_size": 0,
   "num_beams": 1,
   "num_experts": 4,
   "num_experts_per_tok": 2,
   "pad_token_id": 151643,
   "pipeline_tag": "automatic-speech-recognition",
   "pretrained_model_path": "mazesmazes/tiny-audio-embedded",
   "projector_hidden_dim": 2048,
   "projector_pool_stride": 4,
   "projector_type": "mlp",
   "qformer_hidden_size": null,
     "attention_bias": false,
     "attention_dropout": 0.0,
     "bos_token_id": null,
+    "dtype": "float32",
     "eos_token_id": 151645,
     "head_dim": 128,
     "hidden_act": "silu",
     "vocab_size": 151670
   },
   "text_model_id": "Qwen/Qwen3-0.6B",
   "top_k": null,
   "top_p": null,
   "transformers_version": "5.6.1",
   "use_cache": false,
   "use_lora": false,
   "vocab_size": 151670
 }

generation_config.json CHANGED Viewed

@@ -6,7 +6,7 @@
     151643
   ],
   "length_penalty": 1.0,
-  "max_new_tokens": 128,
   "min_new_tokens": 0,
   "no_repeat_ngram_size": 0,
   "num_beams": 1,

     151643
   ],
   "length_penalty": 1.0,
+  "max_new_tokens": 256,
   "min_new_tokens": 0,
   "no_repeat_ngram_size": 0,
   "num_beams": 1,

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4a55b8ac11eccbfd0b8b99049ce9bf61b925eac0c0555cbc851655d947771644
-size 1216765200

 version https://git-lfs.github.com/spec/v1
+oid sha256:bfb90942db267303d69bdea633cf63552c2c39a7982770a9ff1cbfca06b2d82d
+size 2433494416

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a1d8254e80afa51faadc78d03c6c356349ceecfcba493d79a26fe65541649e65
 size 5329

 version https://git-lfs.github.com/spec/v1
+oid sha256:c48a0a666b225969b861fcb86f68f1011c614c2b04bc3f107efa23ad74095078
 size 5329