Training in progress, epoch 0

Files changed (16) hide show

adapter_config.json ADDED Viewed

+{
+  "alpha_pattern": {},
+  "auto_mapping": null,
+  "base_model_name_or_path": "facebook/opt-125m",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layer_replication": null,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "loftq_config": {},
+  "lora_alpha": 128,
+  "lora_dropout": 0.05,
+  "megatron_config": null,
+  "megatron_core": "megatron.core",
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 256,
+  "rank_pattern": {},
+  "revision": null,
+  "target_modules": [
+    "q_proj",
+    "fc2",
+    "k_proj",
+    "out_proj",
+    "v_proj",
+    "fc1"
+  ],
+  "task_type": "CAUSAL_LM",
+  "use_dora": false,
+  "use_rslora": false
+}

adapter_model.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:4954052ddd512b5809e7052691755651aaf943eb599a2f1cc54b15aaef38b4c1
+size 478730240

added_tokens.json ADDED Viewed

+{
+  "<|im_end|>": 50266,
+  "<|im_start|>": 50265
+}

merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

runs/Sep13_09-49-40_sifs-dgx/events.out.tfevents.1726213790.sifs-dgx.33.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:2c8d452405d2681c8ef548b4d4d385e1bdcf4661ac089f48e827fc2c87cf0ffc
+size 5898

runs/Sep13_12-36-10_sifs-dgx/events.out.tfevents.1726223774.sifs-dgx.33.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:351114d2ca8cd274297223ce01d66d452850f34dea954e137b31ea78d1afe32f
+size 5917

runs/Sep13_12-46-15_sifs-dgx/events.out.tfevents.1726224378.sifs-dgx.33.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:853592b299c1177ef4abcfdf768ef1e51b6b6e02c45bad2c006ae67a893454ce
+size 5917

runs/Sep13_12-47-38_sifs-dgx/events.out.tfevents.1726224462.sifs-dgx.33.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:55417a5b114a1e19e37bacba6f07a7d05b5720361bd30de1947c61ff4e32ec8d
+size 5917

runs/Sep13_12-54-40_sifs-dgx/events.out.tfevents.1726224883.sifs-dgx.33.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:77025fb4229eff04ae6a59d2dd0299e37e291a4d0acf35d509e7bdece209bea4
+size 7780

special_tokens_map.json ADDED Viewed

+{
+  "additional_special_tokens": [
+    {
+      "content": "<|im_start|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false
+    },
+    {
+      "content": "<|im_end|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false
+    }
+  ],
+  "bos_token": "<|im_start|>",
+  "eos_token": "<|im_end|>",
+  "pad_token": "<|im_end|>",
+  "unk_token": {
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  }
+}

test_dataset.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json ADDED Viewed

+{
+  "add_bos_token": true,
+  "add_prefix_space": false,
+  "added_tokens_decoder": {
+    "1": {
+      "content": "<pad>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "50265": {
+      "content": "<|im_start|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "50266": {
+      "content": "<|im_end|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "additional_special_tokens": [
+    "<|im_start|>",
+    "<|im_end|>"
+  ],
+  "bos_token": "<|im_start|>",
+  "chat_template": "{% for message in messages %}{{'<|im_start|>' + message['role'] + '\n' + message['content'] + '<|im_end|>' + '\n'}}{% endfor %}{% if add_generation_prompt %}{{ '<|im_start|>assistant\n' }}{% endif %}",
+  "clean_up_tokenization_spaces": true,
+  "eos_token": "<|im_end|>",
+  "errors": "replace",
+  "model_max_length": 1000000000000000019884624838656,
+  "pad_token": "<|im_end|>",
+  "tokenizer_class": "GPT2Tokenizer",
+  "unk_token": "</s>"
+}

train_dataset.json ADDED Viewed

The diff for this file is too large to render. See raw diff

training_args.bin ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:4df05743fd778f8813b5d8b536e839b57fd6527ef38b4a272d0a27ff6d67ce62
+size 5560

vocab.json ADDED Viewed

The diff for this file is too large to render. See raw diff