Holmeister
/

LLama3_deneme

Generated from Trainer

Model card Files Files and versions Community

Holmeister commited on Jun 8

Commit

258a8dd

•

1 Parent(s): 8fe8f3f

Model save

Files changed (2) hide show

README.md +12 -5
adapter_model.safetensors +1 -1

README.md CHANGED Viewed

@@ -2,7 +2,6 @@
 library_name: peft
 tags:
 - llama-factory
-- lora
 - generated_from_trainer
 base_model: meta-llama/Meta-Llama-3-8B
 model-index:
@@ -15,9 +14,9 @@ should probably proofread and complete it, then remove this comment. -->
 # LLama3_deneme
-This model is a fine-tuned version of [meta-llama/Meta-Llama-3-8B](https://huggingface.co/meta-llama/Meta-Llama-3-8B) on the emollms_ei_oc_mixed dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.1256
 ## Model description
@@ -44,13 +43,21 @@ The following hyperparameters were used during training:
 - total_train_batch_size: 256
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: cosine
-- num_epochs: 0.5
 ### Training results
 | Training Loss | Epoch  | Step | Validation Loss |
 |:-------------:|:------:|:----:|:---------------:|
-| 0.3294        | 0.3320 | 10   | 0.1256          |
 ### Framework versions

 library_name: peft
 tags:
 - llama-factory
 - generated_from_trainer
 base_model: meta-llama/Meta-Llama-3-8B
 model-index:
 # LLama3_deneme
+This model is a fine-tuned version of [meta-llama/Meta-Llama-3-8B](https://huggingface.co/meta-llama/Meta-Llama-3-8B) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.0806
 ## Model description
 - total_train_batch_size: 256
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: cosine
+- num_epochs: 3.0
 ### Training results
 | Training Loss | Epoch  | Step | Validation Loss |
 |:-------------:|:------:|:----:|:---------------:|
+| 0.3319        | 0.3320 | 10   | 0.1265          |
+| 0.113         | 0.6639 | 20   | 0.0951          |
+| 0.0961        | 0.9959 | 30   | 0.0864          |
+| 0.0908        | 1.3278 | 40   | 0.0838          |
+| 0.0846        | 1.6598 | 50   | 0.0816          |
+| 0.0806        | 1.9917 | 60   | 0.0802          |
+| 0.0756        | 2.3237 | 70   | 0.0810          |
+| 0.0751        | 2.6556 | 80   | 0.0805          |
+| 0.0719        | 2.9876 | 90   | 0.0806          |
 ### Framework versions

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8daadfa37bee37b1f4d6a42c9760d6ecb83dcde529fcd878c695aa8d0eead309
 size 83945296

 version https://git-lfs.github.com/spec/v1
+oid sha256:f162bc5fb0a32b3068ff4067e39aa4ec372e173e497f4752c123bb92d275b01e
 size 83945296