End of training

Files changed (7) hide show

README.md CHANGED Viewed

@@ -38,11 +38,11 @@ The following hyperparameters were used during training:
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
-- num_epochs: 1
 ### Framework versions
-- Transformers 4.40.0
-- Pytorch 2.2.2+cu121
 - Datasets 2.18.0
 - Tokenizers 0.19.1

 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
+- num_epochs: 3.0
 ### Framework versions
+- Transformers 4.41.2
+- Pytorch 2.2.1+cu121
 - Datasets 2.18.0
 - Tokenizers 0.19.1

config.json CHANGED Viewed

@@ -23,7 +23,7 @@
   "rotary_pct": 0.25,
   "tie_word_embeddings": false,
   "torch_dtype": "float32",
-  "transformers_version": "4.40.0",
   "use_cache": true,
   "use_parallel_residual": true,
   "vocab_size": 50304

   "rotary_pct": 0.25,
   "tie_word_embeddings": false,
   "torch_dtype": "float32",
+  "transformers_version": "4.41.2",
   "use_cache": true,
   "use_parallel_residual": true,
   "vocab_size": 50304

generation_config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
   "_from_model_config": true,
   "bos_token_id": 0,
-  "transformers_version": "4.40.0"
 }

 {
   "_from_model_config": true,
   "bos_token_id": 0,
+  "transformers_version": "4.41.2"
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d829d1a5cf66032491679d64c5b18e85b82d37833a99c346905668b8553084d5
 size 649308728

 version https://git-lfs.github.com/spec/v1
+oid sha256:6d03570d2090edc3ff824756f88fa034e82eb8c2f3be3167528d62c50702eeb2
 size 649308728

runs/Jun20_19-33-21_ip-26-0-163-127/events.out.tfevents.1718912007.ip-26-0-163-127.2650686.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:d9422b591020bb0fe1956adf194f57f5e114f312a80aee17902b4db61012618f
+size 157024

tokenizer_config.json CHANGED Viewed

@@ -213,7 +213,7 @@
     }
   },
   "bos_token": "<|endoftext|>",
-  "chat_template": "{% for message in messages %}{{' ' + message['content']}}{% endfor %}{{ eos_token }}",
   "clean_up_tokenization_spaces": true,
   "eos_token": "<|endoftext|>",
   "model_max_length": 1000000000000000019884624838656,

     }
   },
   "bos_token": "<|endoftext|>",
+  "chat_template": "{% for message in messages %}{{' ' if not loop.first else ''}}{{message['content']}}{% endfor %}{{eos_token}}",
   "clean_up_tokenization_spaces": true,
   "eos_token": "<|endoftext|>",
   "model_max_length": 1000000000000000019884624838656,

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:bbf6c9144b1627e0694edbfcbc946a39fa86174d16e1b616392f475d568acb09
-size 5880

 version https://git-lfs.github.com/spec/v1
+oid sha256:c1bfc7bf13c40dbd55643bb8215823f8afe99be4e3c9bd605d749b6a87dc9682
+size 5944