Training in progress, epoch 1

Files changed (6) hide show

README.md CHANGED Viewed

@@ -1,12 +1,58 @@
 ---
-license: apache-2.0
-datasets:
-- cnn_dailymail
-language:
-- en
-metrics:
-- accuracy
-library_name: adapter-transformers
-pipeline_tag: text-generation
 ---

 ---
+license: mit
+library_name: peft
+tags:
+- trl
+- sft
+- generated_from_trainer
+base_model: microsoft/phi-1_5
+model-index:
+- name: phi-1_5-finetuned-news-events
+  results: []
 ---
+<!-- This model card has been generated automatically according to the information the Trainer had access to. You
+should probably proofread and complete it, then remove this comment. -->
+# phi-1_5-finetuned-news-events
+This model is a fine-tuned version of [microsoft/phi-1_5](https://huggingface.co/microsoft/phi-1_5) on an unknown dataset.
+It achieves the following results on the evaluation set:
+- Loss: 2.3737
+## Model description
+More information needed
+## Intended uses & limitations
+More information needed
+## Training and evaluation data
+More information needed
+## Training procedure
+### Training hyperparameters
+The following hyperparameters were used during training:
+- learning_rate: 0.0002
+- train_batch_size: 4
+- eval_batch_size: 8
+- seed: 42
+- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
+- lr_scheduler_type: cosine
+- training_steps: 800
+### Training results
+### Framework versions
+- PEFT 0.10.0
+- Transformers 4.38.2
+- Pytorch 2.2.1+cu121
+- Datasets 2.18.0
+- Tokenizers 0.15.2

adapter_config.json CHANGED Viewed

@@ -21,9 +21,9 @@
   "revision": null,
   "target_modules": [
     "q_proj",
-    "v_proj",
     "fc1",
-    "fc2"
   ],
   "task_type": "CAUSAL_LM",
   "use_dora": false,

   "revision": null,
   "target_modules": [
     "q_proj",
+    "fc2",
     "fc1",
+    "v_proj"
   ],
   "task_type": "CAUSAL_LM",
   "use_dora": false,

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7f692bb425949c3da2374dacaed5f62c6da40cc58c01dca6d55102e876b1dcc0
 size 44065120

 version https://git-lfs.github.com/spec/v1
+oid sha256:498d9df7f6490829c475dde4eadfec874b1484b036fc8eafa2b47245ede36f06
 size 44065120

runs/Mar24_16-34-17_037bd97f1394/events.out.tfevents.1711298307.037bd97f1394.1021.4 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9e9510d983b55f391ca9be5d50f842a911d3853caffd3c279269f50cda8e2dc0
-size 359

 version https://git-lfs.github.com/spec/v1
+oid sha256:2b79cc3f85cd7b0044d218654a18328eff36368b12a98cbe17d68162fab7fb2f
+size 630

runs/Mar24_17-04-01_037bd97f1394/events.out.tfevents.1711299842.037bd97f1394.12351.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:de11c36e4574985794bc4993c74e0bff21dd5d7bb18dbeef4deb2baa95995d72
+size 173942

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fd7606a4a9dca2e02c6c73cb9622bb2be776be9ba8b5131f3baa34a0342d3ab1
 size 4920

 version https://git-lfs.github.com/spec/v1
+oid sha256:3ac645cb2eaf8b7a56bfef751714c7945718d38ded43cd6c9e900e686aed4373
 size 4920