LongshenOu commited on Jun 20

Commit

149c9ba

•

1 Parent(s): 41f1394

End of training

Browse files

Files changed (32) hide show

README.md +54 -0
config.json +39 -0
generation_config.json +6 -0
model.safetensors +3 -0
runs/Jun20_05-01-14_smc-gpu3/events.out.tfevents.1718859678.smc-gpu3.126680.0 +3 -0
runs/Jun20_05-02-10_smc-gpu3/events.out.tfevents.1718859732.smc-gpu3.126680.1 +3 -0
runs/Jun20_05-08-32_smc-gpu3/events.out.tfevents.1718860116.smc-gpu3.126680.2 +3 -0
runs/Jun20_05-10-31_smc-gpu3/events.out.tfevents.1718860236.smc-gpu3.126680.3 +3 -0
runs/Jun20_05-12-09_smc-gpu3/events.out.tfevents.1718860332.smc-gpu3.126680.4 +3 -0
runs/Jun20_05-13-16_smc-gpu3/events.out.tfevents.1718860400.smc-gpu3.131587.0 +3 -0
runs/Jun20_05-15-24_smc-gpu3/events.out.tfevents.1718860528.smc-gpu3.132607.0 +3 -0
runs/Jun20_05-15-58_smc-gpu3/events.out.tfevents.1718860560.smc-gpu3.132607.1 +3 -0
runs/Jun20_05-16-49_smc-gpu3/events.out.tfevents.1718860613.smc-gpu3.133223.0 +3 -0
runs/Jun20_05-23-07_smc-gpu3/events.out.tfevents.1718860997.smc-gpu3.133223.1 +3 -0
runs/Jun20_05-23-58_smc-gpu3/events.out.tfevents.1718861041.smc-gpu3.136973.0 +3 -0
runs/Jun20_05-24-18_smc-gpu3/events.out.tfevents.1718861061.smc-gpu3.136973.1 +3 -0
runs/Jun20_05-34-30_smc-gpu3/events.out.tfevents.1718861672.smc-gpu3.136973.2 +3 -0
runs/Jun20_05-35-05_smc-gpu3/events.out.tfevents.1718861707.smc-gpu3.139838.0 +3 -0
runs/Jun20_05-51-37_smc-gpu3/events.out.tfevents.1718862701.smc-gpu3.148769.0 +3 -0
runs/Jun20_05-52-57_smc-gpu3/events.out.tfevents.1718862781.smc-gpu3.149973.0 +3 -0
runs/Jun20_06-07-03_smc-gpu3/events.out.tfevents.1718863626.smc-gpu3.149973.1 +3 -0
runs/Jun20_06-16-58_smc-gpu3/events.out.tfevents.1718864221.smc-gpu3.149973.2 +3 -0
runs/Jun20_06-17-48_smc-gpu3/events.out.tfevents.1718864270.smc-gpu3.149973.3 +3 -0
runs/Jun20_06-18-35_smc-gpu3/events.out.tfevents.1718864318.smc-gpu3.149973.4 +3 -0
runs/Jun20_06-19-31_smc-gpu3/events.out.tfevents.1718864374.smc-gpu3.161446.0 +3 -0
runs/Jun20_06-20-37_smc-gpu3/events.out.tfevents.1718864441.smc-gpu3.161972.0 +3 -0
runs/Jun20_09-20-46_smc-gpu3/events.out.tfevents.1718875248.smc-gpu3.205648.0 +3 -0
runs/Jun20_09-55-03_smc-gpu3/events.out.tfevents.1718877306.smc-gpu3.205648.1 +3 -0
special_tokens_map.json +45 -0
tokenizer.json +0 -0
tokenizer_config.json +0 -0
training_args.bin +3 -0

README.md ADDED Viewed

	@@ -0,0 +1,54 @@

+---
+tags:
+- generated_from_trainer
+model-index:
+- name: m2m_pt
+  results: []
+---
+<!-- This model card has been generated automatically according to the information the Trainer had access to. You
+should probably proofread and complete it, then remove this comment. -->
+# m2m_pt
+This model was trained from scratch on an unknown dataset.
+## Model description
+More information needed
+## Intended uses & limitations
+More information needed
+## Training and evaluation data
+More information needed
+## Training procedure
+### Training hyperparameters
+The following hyperparameters were used during training:
+- learning_rate: 0.0005
+- train_batch_size: 12
+- eval_batch_size: 12
+- seed: 42
+- gradient_accumulation_steps: 8
+- total_train_batch_size: 96
+- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
+- lr_scheduler_type: cosine
+- lr_scheduler_warmup_steps: 1000
+- num_epochs: 1
+- mixed_precision_training: Native AMP
+### Training results
+### Framework versions
+- Transformers 4.40.0.dev0
+- Pytorch 2.0.1+cu117
+- Datasets 2.20.0
+- Tokenizers 0.15.2

config.json ADDED Viewed

	@@ -0,0 +1,39 @@

+{
+  "_name_or_path": "test_model",
+  "activation_function": "gelu_new",
+  "architectures": [
+    "GPT2LMHeadModel"
+  ],
+  "attn_pdrop": 0.1,
+  "bos_token_id": 2,
+  "embd_pdrop": 0.1,
+  "eos_token_id": 1,
+  "initializer_range": 0.02,
+  "layer_norm_epsilon": 1e-05,
+  "model_type": "gpt2",
+  "n_ctx": 2048,
+  "n_embd": 768,
+  "n_head": 16,
+  "n_inner": null,
+  "n_layer": 12,
+  "n_positions": 2048,
+  "reorder_and_upcast_attn": false,
+  "resid_pdrop": 0.1,
+  "scale_attn_by_inverse_layer_idx": false,
+  "scale_attn_weights": true,
+  "summary_activation": null,
+  "summary_first_dropout": 0.1,
+  "summary_proj_to_labels": true,
+  "summary_type": "cls_index",
+  "summary_use_proj": true,
+  "task_specific_params": {
+    "text-generation": {
+      "do_sample": true,
+      "max_length": 50
+    }
+  },
+  "torch_dtype": "bfloat16",
+  "transformers_version": "4.40.0.dev0",
+  "use_cache": true,
+  "vocab_size": 989
+}

generation_config.json ADDED Viewed

	@@ -0,0 +1,6 @@

+{
+  "_from_model_config": true,
+  "bos_token_id": 2,
+  "eos_token_id": 1,
+  "transformers_version": "4.40.0.dev0"
+}

model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:03683952ad3cd90b64018db92971f35c661a578c2fc983be2bb6413b0136083f
+size 174791872

runs/Jun20_05-01-14_smc-gpu3/events.out.tfevents.1718859678.smc-gpu3.126680.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0dc515b5d81bc6f582e11aa26c4c043c3184add77554aaf7752bad42487a28a7
+size 4860

runs/Jun20_05-02-10_smc-gpu3/events.out.tfevents.1718859732.smc-gpu3.126680.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f1d5a45daa85458bf6f9af05cbe2ec7eff128d3f5d19289370edee59beb416da
+size 5067

runs/Jun20_05-08-32_smc-gpu3/events.out.tfevents.1718860116.smc-gpu3.126680.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:66a7dddc63da4f02c87f81b6af8d94168630fac119828dfe4abac8b3a58df3ee
+size 5068

runs/Jun20_05-10-31_smc-gpu3/events.out.tfevents.1718860236.smc-gpu3.126680.3 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5571d0d15e90fe280cd331e5c6a1212d618b6a34e59dd960337d02db865d93e2
+size 5489

runs/Jun20_05-12-09_smc-gpu3/events.out.tfevents.1718860332.smc-gpu3.126680.4 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4a44ed9b1fc39baab3000d69d6596338a4265270cdc9e051d49e5124b1529baa
+size 4868

runs/Jun20_05-13-16_smc-gpu3/events.out.tfevents.1718860400.smc-gpu3.131587.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3f9461b9f8a3a2d3c292fe82e6c9bac710c0673ff919a525507d2aa12aeeff6e
+size 5282

runs/Jun20_05-15-24_smc-gpu3/events.out.tfevents.1718860528.smc-gpu3.132607.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8a268947c46b4814499aed3b3c55da50c612a7e6e9ae1098620672d17e88242c
+size 4867

runs/Jun20_05-15-58_smc-gpu3/events.out.tfevents.1718860560.smc-gpu3.132607.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:eb8c47f3c175eb01ecef844aa7056a02652439bdbfaf86ce4eb900e0a4e6ad78
+size 4866

runs/Jun20_05-16-49_smc-gpu3/events.out.tfevents.1718860613.smc-gpu3.133223.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:90fc75958cb63e606a9198f45c57d8e5a32c11423076a2b45f95314c4685783d
+size 7557

runs/Jun20_05-23-07_smc-gpu3/events.out.tfevents.1718860997.smc-gpu3.133223.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:254caf1b2a5b61a6c5c72edb6032b2f287e2884d3cd68450a57cf07cf59a79f3
+size 4867

runs/Jun20_05-23-58_smc-gpu3/events.out.tfevents.1718861041.smc-gpu3.136973.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ce324d454b876f24397abe7709e54ba59ed64d73401b6b39332c523bc018fe44
+size 4867

runs/Jun20_05-24-18_smc-gpu3/events.out.tfevents.1718861061.smc-gpu3.136973.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:94653ee8f46cae73a464aa6d7adf9f230db342cb9bd3a60153041fb68a774738
+size 6937

runs/Jun20_05-34-30_smc-gpu3/events.out.tfevents.1718861672.smc-gpu3.136973.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:db7fee3c70d9ccef273c22490be53011b8a09dd347e44eec94e2c9de814c6711
+size 4867

runs/Jun20_05-35-05_smc-gpu3/events.out.tfevents.1718861707.smc-gpu3.139838.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c61cfd43e1919d0500b225de480dc52ba1bfc5d24a56fcea48c10d5166c4c9df
+size 12785

runs/Jun20_05-51-37_smc-gpu3/events.out.tfevents.1718862701.smc-gpu3.148769.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8832db673c85e4d03579b074acfdf519467789bf0eeeb17c345fedecc4a758ad
+size 4867

runs/Jun20_05-52-57_smc-gpu3/events.out.tfevents.1718862781.smc-gpu3.149973.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c4f55da7b6235701f86e24ba98714149934ddbe07bb7a02ca1551a230f02a081
+size 4867

runs/Jun20_06-07-03_smc-gpu3/events.out.tfevents.1718863626.smc-gpu3.149973.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d35e4bf1be747abb3cf71b8d865ff279340efefef5e22b5fc701f5e286163b93
+size 7765

runs/Jun20_06-16-58_smc-gpu3/events.out.tfevents.1718864221.smc-gpu3.149973.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:41b7dba08777ea81e80cb5a0f25117b025f9aab932acc2db6b3bc28ea718b943
+size 5902

runs/Jun20_06-17-48_smc-gpu3/events.out.tfevents.1718864270.smc-gpu3.149973.3 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:27e5477df0ea0ac9eb7157becdcb77e024742d0cf2a99853c8ecd88956072ca8
+size 5281

runs/Jun20_06-18-35_smc-gpu3/events.out.tfevents.1718864318.smc-gpu3.149973.4 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d9e73c1cc1f4d52ba60cba1b9727428d2208f4be16e6ce16257b13a35a972f98
+size 4867

runs/Jun20_06-19-31_smc-gpu3/events.out.tfevents.1718864374.smc-gpu3.161446.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:68acc57a4eb7af1df5be0b0e4f961fd46abeee1b76e19d6f192491012e14716b
+size 4867

runs/Jun20_06-20-37_smc-gpu3/events.out.tfevents.1718864441.smc-gpu3.161972.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e06f69a2ffe598ee79a3250838abc028b92a09339de2ded336c90c3dfac04486
+size 5902

runs/Jun20_09-20-46_smc-gpu3/events.out.tfevents.1718875248.smc-gpu3.205648.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ee02ca5daabf5202b0f6dc8c7e1c10b0de1d7cd13c8614698975ec204a563b85
+size 20592

runs/Jun20_09-55-03_smc-gpu3/events.out.tfevents.1718877306.smc-gpu3.205648.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cb86d2f915855f0f640b880bf5421119f93466c52c43479d2763278513c9beab
+size 5215

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,45 @@

+{
+  "bos_token": {
+    "content": "[BOS]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "cls_token": {
+    "content": "[CLS]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "content": "[EOS]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "mask_token": {
+    "content": "[MASK]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": "[EOS]",
+  "sep_token": {
+    "content": "[SEP]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "unk_token": {
+    "content": "[UNK]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
+}

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json ADDED Viewed

The diff for this file is too large to render. See raw diff

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9aefdecf499035c9c781d3ddc8de54d72659e515cafd3b917f4130b179bd3657
+size 4475