wangrongsheng commited on Aug 31, 2023

Commit

c102729

1 Parent(s): 3f7e522

commit from root

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

README.md +20 -0
adapter_config.json +21 -0
adapter_model.bin +3 -0
all_results.json +7 -0
checkpoint-1000/README.md +20 -0
checkpoint-1000/adapter_config.json +21 -0
checkpoint-1000/adapter_model.bin +3 -0
checkpoint-1000/finetuning_args.json +16 -0
checkpoint-1000/optimizer.pt +3 -0
checkpoint-1000/rng_state_0.pth +3 -0
checkpoint-1000/rng_state_1.pth +3 -0
checkpoint-1000/rng_state_2.pth +3 -0
checkpoint-1000/scheduler.pt +3 -0
checkpoint-1000/trainer_state.json +616 -0
checkpoint-1000/training_args.bin +3 -0
checkpoint-2000/README.md +20 -0
checkpoint-2000/adapter_config.json +21 -0
checkpoint-2000/adapter_model.bin +3 -0
checkpoint-2000/finetuning_args.json +16 -0
checkpoint-2000/optimizer.pt +3 -0
checkpoint-2000/rng_state_0.pth +3 -0
checkpoint-2000/rng_state_1.pth +3 -0
checkpoint-2000/rng_state_2.pth +3 -0
checkpoint-2000/scheduler.pt +3 -0
checkpoint-2000/trainer_state.json +1216 -0
checkpoint-2000/training_args.bin +3 -0
checkpoint-3000/README.md +20 -0
checkpoint-3000/adapter_config.json +21 -0
checkpoint-3000/adapter_model.bin +3 -0
checkpoint-3000/finetuning_args.json +16 -0
checkpoint-3000/optimizer.pt +3 -0
checkpoint-3000/rng_state_0.pth +3 -0
checkpoint-3000/rng_state_1.pth +3 -0
checkpoint-3000/rng_state_2.pth +3 -0
checkpoint-3000/scheduler.pt +3 -0
checkpoint-3000/trainer_state.json +1816 -0
checkpoint-3000/training_args.bin +3 -0
checkpoint-4000/README.md +20 -0
checkpoint-4000/adapter_config.json +21 -0
checkpoint-4000/adapter_model.bin +3 -0
checkpoint-4000/finetuning_args.json +16 -0
checkpoint-4000/optimizer.pt +3 -0
checkpoint-4000/rng_state_0.pth +3 -0
checkpoint-4000/rng_state_1.pth +3 -0
checkpoint-4000/rng_state_2.pth +3 -0
checkpoint-4000/scheduler.pt +3 -0
checkpoint-4000/trainer_state.json +2416 -0
checkpoint-4000/training_args.bin +3 -0
checkpoint-5000/README.md +20 -0
checkpoint-5000/adapter_config.json +21 -0

README.md ADDED Viewed

	@@ -0,0 +1,20 @@

+---
+library_name: peft
+---
+## Training procedure
+The following `bitsandbytes` quantization config was used during training:
+- load_in_8bit: False
+- load_in_4bit: True
+- llm_int8_threshold: 6.0
+- llm_int8_skip_modules: None
+- llm_int8_enable_fp32_cpu_offload: False
+- llm_int8_has_fp16_weight: False
+- bnb_4bit_quant_type: nf4
+- bnb_4bit_use_double_quant: True
+- bnb_4bit_compute_dtype: float16
+### Framework versions
+- PEFT 0.4.0

adapter_config.json ADDED Viewed

	@@ -0,0 +1,21 @@

+{
+  "auto_mapping": null,
+  "base_model_name_or_path": "./Llama-2-7b-chat-hf",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 32.0,
+  "lora_dropout": 0.1,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 8,
+  "revision": null,
+  "target_modules": [
+    "q_proj",
+    "v_proj"
+  ],
+  "task_type": "CAUSAL_LM"
+}

adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4368dd6a27f87f5b0669b99d1bf2c8c71855de07034dbcfe61195d8eefc4f9ce
+size 16821197

all_results.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+    "epoch": 2.0,
+    "train_loss": 0.7826863387384284,
+    "train_runtime": 100268.7949,
+    "train_samples_per_second": 6.462,
+    "train_steps_per_second": 0.067
+}

checkpoint-1000/README.md ADDED Viewed

	@@ -0,0 +1,20 @@

+---
+library_name: peft
+---
+## Training procedure
+The following `bitsandbytes` quantization config was used during training:
+- load_in_8bit: False
+- load_in_4bit: True
+- llm_int8_threshold: 6.0
+- llm_int8_skip_modules: None
+- llm_int8_enable_fp32_cpu_offload: False
+- llm_int8_has_fp16_weight: False
+- bnb_4bit_quant_type: nf4
+- bnb_4bit_use_double_quant: True
+- bnb_4bit_compute_dtype: float16
+### Framework versions
+- PEFT 0.4.0

checkpoint-1000/adapter_config.json ADDED Viewed

	@@ -0,0 +1,21 @@

+{
+  "auto_mapping": null,
+  "base_model_name_or_path": "./Llama-2-7b-chat-hf",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 32.0,
+  "lora_dropout": 0.1,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 8,
+  "revision": null,
+  "target_modules": [
+    "q_proj",
+    "v_proj"
+  ],
+  "task_type": "CAUSAL_LM"
+}

checkpoint-1000/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:01d60e225a241cd5560b29edfc885d45b22d33e3621210139dfba429cb06ad0e
+size 16821197

checkpoint-1000/finetuning_args.json ADDED Viewed

	@@ -0,0 +1,16 @@

+{
+  "dpo_beta": 0.1,
+  "finetuning_type": "lora",
+  "lora_alpha": 32.0,
+  "lora_dropout": 0.1,
+  "lora_rank": 8,
+  "lora_target": [
+    "q_proj",
+    "v_proj"
+  ],
+  "name_module_trainable": "mlp",
+  "num_hidden_layers": 32,
+  "num_layer_trainable": 3,
+  "ppo_score_norm": false,
+  "resume_lora_training": true
+}

checkpoint-1000/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7a1c5d57a78b918b65ef7e05c7e61e1f2ac502bb9ce489b5aa3e1c97e6c81094
+size 33661637

checkpoint-1000/rng_state_0.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c91a43c96592d2f3f8005a8c57078635c83dcd2d505c009e27479785d727aa23
+size 18679

checkpoint-1000/rng_state_1.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3353bea80f838cc0c11067bc759bc1b19feead95c9fb1486b8d9d45ea5c53757
+size 18679

checkpoint-1000/rng_state_2.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:468555d3ee30c066dd6eb5e97490bff31eb9755b7f5fb041f2afce47110ffc54
+size 18679

checkpoint-1000/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2eba20c386c6cddbfa9305a435bd87f8b87262d92ccda73c302a46ba26396e5d
+size 627

checkpoint-1000/trainer_state.json ADDED Viewed

	@@ -0,0 +1,616 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 0.29631824579598487,
+  "global_step": 1000,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.0,
+      "learning_rate": 4.9999729068921297e-05,
+      "loss": 1.369,
+      "step": 10
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 4.9998916281557476e-05,
+      "loss": 1.1704,
+      "step": 20
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 4.999772150012383e-05,
+      "loss": 1.131,
+      "step": 30
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 4.99958792440589e-05,
+      "loss": 1.0618,
+      "step": 40
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 4.999401536044942e-05,
+      "loss": 1.0539,
+      "step": 50
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 4.9991197949909295e-05,
+      "loss": 1.0157,
+      "step": 60
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 4.998783886799168e-05,
+      "loss": 1.0235,
+      "step": 70
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 4.998393818750294e-05,
+      "loss": 0.9841,
+      "step": 80
+    },
+    {
+      "epoch": 0.03,
+      "learning_rate": 4.9979495992988316e-05,
+      "loss": 0.9787,
+      "step": 90
+    },
+    {
+      "epoch": 0.03,
+      "learning_rate": 4.997451238073011e-05,
+      "loss": 0.9716,
+      "step": 100
+    },
+    {
+      "epoch": 0.03,
+      "learning_rate": 4.996898745874553e-05,
+      "loss": 0.9718,
+      "step": 110
+    },
+    {
+      "epoch": 0.04,
+      "learning_rate": 4.996292134678445e-05,
+      "loss": 0.9608,
+      "step": 120
+    },
+    {
+      "epoch": 0.04,
+      "learning_rate": 4.995631417632672e-05,
+      "loss": 0.9547,
+      "step": 130
+    },
+    {
+      "epoch": 0.04,
+      "learning_rate": 4.994916609057936e-05,
+      "loss": 0.959,
+      "step": 140
+    },
+    {
+      "epoch": 0.04,
+      "learning_rate": 4.9941477244473455e-05,
+      "loss": 0.9297,
+      "step": 150
+    },
+    {
+      "epoch": 0.05,
+      "learning_rate": 4.993324780466081e-05,
+      "loss": 0.927,
+      "step": 160
+    },
+    {
+      "epoch": 0.05,
+      "learning_rate": 4.992447794951029e-05,
+      "loss": 0.9352,
+      "step": 170
+    },
+    {
+      "epoch": 0.05,
+      "learning_rate": 4.9915167869104006e-05,
+      "loss": 0.9244,
+      "step": 180
+    },
+    {
+      "epoch": 0.06,
+      "learning_rate": 4.990531776523317e-05,
+      "loss": 0.9185,
+      "step": 190
+    },
+    {
+      "epoch": 0.06,
+      "learning_rate": 4.9894927851393726e-05,
+      "loss": 0.9201,
+      "step": 200
+    },
+    {
+      "epoch": 0.06,
+      "learning_rate": 4.988399835278171e-05,
+      "loss": 0.9053,
+      "step": 210
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 4.987252950628839e-05,
+      "loss": 0.912,
+      "step": 220
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 4.986052156049513e-05,
+      "loss": 0.9013,
+      "step": 230
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 4.984797477566799e-05,
+      "loss": 0.8942,
+      "step": 240
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 4.9834889423752074e-05,
+      "loss": 0.8873,
+      "step": 250
+    },
+    {
+      "epoch": 0.08,
+      "learning_rate": 4.9821265788365664e-05,
+      "loss": 0.9036,
+      "step": 260
+    },
+    {
+      "epoch": 0.08,
+      "learning_rate": 4.980710416479407e-05,
+      "loss": 0.901,
+      "step": 270
+    },
+    {
+      "epoch": 0.08,
+      "learning_rate": 4.97924048599832e-05,
+      "loss": 0.8941,
+      "step": 280
+    },
+    {
+      "epoch": 0.09,
+      "learning_rate": 4.977716819253293e-05,
+      "loss": 0.8886,
+      "step": 290
+    },
+    {
+      "epoch": 0.09,
+      "learning_rate": 4.97613944926902e-05,
+      "loss": 0.8852,
+      "step": 300
+    },
+    {
+      "epoch": 0.09,
+      "learning_rate": 4.974508410234187e-05,
+      "loss": 0.8877,
+      "step": 310
+    },
+    {
+      "epoch": 0.09,
+      "learning_rate": 4.972823737500725e-05,
+      "loss": 0.8833,
+      "step": 320
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 4.971085467583051e-05,
+      "loss": 0.869,
+      "step": 330
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 4.969293638157273e-05,
+      "loss": 0.877,
+      "step": 340
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 4.967448288060372e-05,
+      "loss": 0.8793,
+      "step": 350
+    },
+    {
+      "epoch": 0.11,
+      "learning_rate": 4.9655494572893644e-05,
+      "loss": 0.8742,
+      "step": 360
+    },
+    {
+      "epoch": 0.11,
+      "learning_rate": 4.9635971870004316e-05,
+      "loss": 0.8774,
+      "step": 370
+    },
+    {
+      "epoch": 0.11,
+      "learning_rate": 4.961591519508029e-05,
+      "loss": 0.8682,
+      "step": 380
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 4.9595324982839686e-05,
+      "loss": 0.8581,
+      "step": 390
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 4.957420167956479e-05,
+      "loss": 0.868,
+      "step": 400
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 4.955254574309234e-05,
+      "loss": 0.8672,
+      "step": 410
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 4.9530357642803646e-05,
+      "loss": 0.8672,
+      "step": 420
+    },
+    {
+      "epoch": 0.13,
+      "learning_rate": 4.950763785961436e-05,
+      "loss": 0.867,
+      "step": 430
+    },
+    {
+      "epoch": 0.13,
+      "learning_rate": 4.948438688596414e-05,
+      "loss": 0.8612,
+      "step": 440
+    },
+    {
+      "epoch": 0.13,
+      "learning_rate": 4.946060522580588e-05,
+      "loss": 0.8607,
+      "step": 450
+    },
+    {
+      "epoch": 0.14,
+      "learning_rate": 4.943629339459484e-05,
+      "loss": 0.8588,
+      "step": 460
+    },
+    {
+      "epoch": 0.14,
+      "learning_rate": 4.9411451919277484e-05,
+      "loss": 0.8585,
+      "step": 470
+    },
+    {
+      "epoch": 0.14,
+      "learning_rate": 4.9386081338280035e-05,
+      "loss": 0.8574,
+      "step": 480
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 4.9360182201496785e-05,
+      "loss": 0.8562,
+      "step": 490
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 4.933375507027824e-05,
+      "loss": 0.8634,
+      "step": 500
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 4.930680051741887e-05,
+      "loss": 0.8483,
+      "step": 510
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 4.9279319127144775e-05,
+      "loss": 0.8559,
+      "step": 520
+    },
+    {
+      "epoch": 0.16,
+      "learning_rate": 4.9251311495100974e-05,
+      "loss": 0.8526,
+      "step": 530
+    },
+    {
+      "epoch": 0.16,
+      "learning_rate": 4.9222778228338506e-05,
+      "loss": 0.85,
+      "step": 540
+    },
+    {
+      "epoch": 0.16,
+      "learning_rate": 4.919371994530125e-05,
+      "loss": 0.8547,
+      "step": 550
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 4.9164137275812597e-05,
+      "loss": 0.8533,
+      "step": 560
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 4.913403086106167e-05,
+      "loss": 0.8431,
+      "step": 570
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 4.9103401353589585e-05,
+      "loss": 0.8346,
+      "step": 580
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 4.9072249417275164e-05,
+      "loss": 0.8448,
+      "step": 590
+    },
+    {
+      "epoch": 0.18,
+      "learning_rate": 4.9040575727320606e-05,
+      "loss": 0.8477,
+      "step": 600
+    },
+    {
+      "epoch": 0.18,
+      "learning_rate": 4.90083809702369e-05,
+      "loss": 0.8555,
+      "step": 610
+    },
+    {
+      "epoch": 0.18,
+      "learning_rate": 4.897566584382884e-05,
+      "loss": 0.8295,
+      "step": 620
+    },
+    {
+      "epoch": 0.19,
+      "learning_rate": 4.8942431057180015e-05,
+      "loss": 0.8359,
+      "step": 630
+    },
+    {
+      "epoch": 0.19,
+      "learning_rate": 4.890867733063733e-05,
+      "loss": 0.8521,
+      "step": 640
+    },
+    {
+      "epoch": 0.19,
+      "learning_rate": 4.887440539579547e-05,
+      "loss": 0.8349,
+      "step": 650
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 4.883961599548103e-05,
+      "loss": 0.8285,
+      "step": 660
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 4.8804309883736377e-05,
+      "loss": 0.831,
+      "step": 670
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 4.876848782580336e-05,
+      "loss": 0.8295,
+      "step": 680
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 4.873215059810666e-05,
+      "loss": 0.8406,
+      "step": 690
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 4.8695298988237035e-05,
+      "loss": 0.8456,
+      "step": 700
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 4.8657933794934205e-05,
+      "loss": 0.8218,
+      "step": 710
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 4.8620055828069535e-05,
+      "loss": 0.8424,
+      "step": 720
+    },
+    {
+      "epoch": 0.22,
+      "learning_rate": 4.858166590862849e-05,
+      "loss": 0.8258,
+      "step": 730
+    },
+    {
+      "epoch": 0.22,
+      "learning_rate": 4.854276486869287e-05,
+      "loss": 0.8352,
+      "step": 740
+    },
+    {
+      "epoch": 0.22,
+      "learning_rate": 4.850335355142272e-05,
+      "loss": 0.836,
+      "step": 750
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 4.846343281103809e-05,
+      "loss": 0.8388,
+      "step": 760
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 4.842300351280054e-05,
+      "loss": 0.8287,
+      "step": 770
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 4.8382066532994316e-05,
+      "loss": 0.8394,
+      "step": 780
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 4.834062275890745e-05,
+      "loss": 0.8253,
+      "step": 790
+    },
+    {
+      "epoch": 0.24,
+      "learning_rate": 4.829867308881244e-05,
+      "loss": 0.82,
+      "step": 800
+    },
+    {
+      "epoch": 0.24,
+      "learning_rate": 4.825621843194684e-05,
+      "loss": 0.8294,
+      "step": 810
+    },
+    {
+      "epoch": 0.24,
+      "learning_rate": 4.821325970849353e-05,
+      "loss": 0.8275,
+      "step": 820
+    },
+    {
+      "epoch": 0.25,
+      "learning_rate": 4.8169797849560764e-05,
+      "loss": 0.8129,
+      "step": 830
+    },
+    {
+      "epoch": 0.25,
+      "learning_rate": 4.812583379716202e-05,
+      "loss": 0.8215,
+      "step": 840
+    },
+    {
+      "epoch": 0.25,
+      "learning_rate": 4.8081368504195545e-05,
+      "loss": 0.84,
+      "step": 850
+    },
+    {
+      "epoch": 0.25,
+      "learning_rate": 4.803640293442373e-05,
+      "loss": 0.8246,
+      "step": 860
+    },
+    {
+      "epoch": 0.26,
+      "learning_rate": 4.799093806245218e-05,
+      "loss": 0.8179,
+      "step": 870
+    },
+    {
+      "epoch": 0.26,
+      "learning_rate": 4.7944974873708656e-05,
+      "loss": 0.8238,
+      "step": 880
+    },
+    {
+      "epoch": 0.26,
+      "learning_rate": 4.7898514364421655e-05,
+      "loss": 0.8327,
+      "step": 890
+    },
+    {
+      "epoch": 0.27,
+      "learning_rate": 4.785155754159886e-05,
+      "loss": 0.812,
+      "step": 900
+    },
+    {
+      "epoch": 0.27,
+      "learning_rate": 4.780410542300527e-05,
+      "loss": 0.8293,
+      "step": 910
+    },
+    {
+      "epoch": 0.27,
+      "learning_rate": 4.7756159037141185e-05,
+      "loss": 0.8266,
+      "step": 920
+    },
+    {
+      "epoch": 0.28,
+      "learning_rate": 4.7707719423219886e-05,
+      "loss": 0.8209,
+      "step": 930
+    },
+    {
+      "epoch": 0.28,
+      "learning_rate": 4.765878763114513e-05,
+      "loss": 0.8182,
+      "step": 940
+    },
+    {
+      "epoch": 0.28,
+      "learning_rate": 4.760936472148837e-05,
+      "loss": 0.8045,
+      "step": 950
+    },
+    {
+      "epoch": 0.28,
+      "learning_rate": 4.755945176546578e-05,
+      "loss": 0.8126,
+      "step": 960
+    },
+    {
+      "epoch": 0.29,
+      "learning_rate": 4.7509049844915036e-05,
+      "loss": 0.8201,
+      "step": 970
+    },
+    {
+      "epoch": 0.29,
+      "learning_rate": 4.7458160052271883e-05,
+      "loss": 0.8133,
+      "step": 980
+    },
+    {
+      "epoch": 0.29,
+      "learning_rate": 4.7406783490546434e-05,
+      "loss": 0.8157,
+      "step": 990
+    },
+    {
+      "epoch": 0.3,
+      "learning_rate": 4.735492127329928e-05,
+      "loss": 0.817,
+      "step": 1000
+    }
+  ],
+  "max_steps": 6748,
+  "num_train_epochs": 2,
+  "total_flos": 1.778504410981204e+18,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-1000/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5f710e8a04dbb33457b5b725adb1da191a7b05d7ab01f6ec60c73386df9d8286
+size 3277

checkpoint-2000/README.md ADDED Viewed

	@@ -0,0 +1,20 @@

+---
+library_name: peft
+---
+## Training procedure
+The following `bitsandbytes` quantization config was used during training:
+- load_in_8bit: False
+- load_in_4bit: True
+- llm_int8_threshold: 6.0
+- llm_int8_skip_modules: None
+- llm_int8_enable_fp32_cpu_offload: False
+- llm_int8_has_fp16_weight: False
+- bnb_4bit_quant_type: nf4
+- bnb_4bit_use_double_quant: True
+- bnb_4bit_compute_dtype: float16
+### Framework versions
+- PEFT 0.4.0

checkpoint-2000/adapter_config.json ADDED Viewed

	@@ -0,0 +1,21 @@

+{
+  "auto_mapping": null,
+  "base_model_name_or_path": "./Llama-2-7b-chat-hf",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 32.0,
+  "lora_dropout": 0.1,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 8,
+  "revision": null,
+  "target_modules": [
+    "q_proj",
+    "v_proj"
+  ],
+  "task_type": "CAUSAL_LM"
+}

checkpoint-2000/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0023c72d6e86d5947e659fbe1b0955df3db6f307814c12415748c9326c87b577
+size 16821197

checkpoint-2000/finetuning_args.json ADDED Viewed

	@@ -0,0 +1,16 @@

+{
+  "dpo_beta": 0.1,
+  "finetuning_type": "lora",
+  "lora_alpha": 32.0,
+  "lora_dropout": 0.1,
+  "lora_rank": 8,
+  "lora_target": [
+    "q_proj",
+    "v_proj"
+  ],
+  "name_module_trainable": "mlp",
+  "num_hidden_layers": 32,
+  "num_layer_trainable": 3,
+  "ppo_score_norm": false,
+  "resume_lora_training": true
+}

checkpoint-2000/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3c55f01b8687b1be7396a2ba0a869bea48c6f4ba7e11402fa621fac14f79eaff
+size 33661637

checkpoint-2000/rng_state_0.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:27bb9d18d06ab8727ee8c0d76ded639732a23bdc12357cce9eb55d3b23ddfd24
+size 18679

checkpoint-2000/rng_state_1.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1e83fe8157b5cc35063bd106e9aaaf436e7c73ce910a1f2155b6e589fb75ba57
+size 18679

checkpoint-2000/rng_state_2.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2a1a9ff0073355b18dffaf8991e71645c238852f1bfa6ec4cc7bccae2cb83a8f
+size 18679

checkpoint-2000/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6991a324121596d5ed6d1fd72fb64a404c9f9d1ce5484efee7e0117d107705d0
+size 627

checkpoint-2000/trainer_state.json ADDED Viewed

	@@ -0,0 +1,1216 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 0.5926364915919697,
+  "global_step": 2000,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.0,
+      "learning_rate": 4.9999729068921297e-05,
+      "loss": 1.369,
+      "step": 10
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 4.9998916281557476e-05,
+      "loss": 1.1704,
+      "step": 20
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 4.999772150012383e-05,
+      "loss": 1.131,
+      "step": 30
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 4.99958792440589e-05,
+      "loss": 1.0618,
+      "step": 40
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 4.999401536044942e-05,
+      "loss": 1.0539,
+      "step": 50
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 4.9991197949909295e-05,
+      "loss": 1.0157,
+      "step": 60
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 4.998783886799168e-05,
+      "loss": 1.0235,
+      "step": 70
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 4.998393818750294e-05,
+      "loss": 0.9841,
+      "step": 80
+    },
+    {
+      "epoch": 0.03,
+      "learning_rate": 4.9979495992988316e-05,
+      "loss": 0.9787,
+      "step": 90
+    },
+    {
+      "epoch": 0.03,
+      "learning_rate": 4.997451238073011e-05,
+      "loss": 0.9716,
+      "step": 100
+    },
+    {
+      "epoch": 0.03,
+      "learning_rate": 4.996898745874553e-05,
+      "loss": 0.9718,
+      "step": 110
+    },
+    {
+      "epoch": 0.04,
+      "learning_rate": 4.996292134678445e-05,
+      "loss": 0.9608,
+      "step": 120
+    },
+    {
+      "epoch": 0.04,
+      "learning_rate": 4.995631417632672e-05,
+      "loss": 0.9547,
+      "step": 130
+    },
+    {
+      "epoch": 0.04,
+      "learning_rate": 4.994916609057936e-05,
+      "loss": 0.959,
+      "step": 140
+    },
+    {
+      "epoch": 0.04,
+      "learning_rate": 4.9941477244473455e-05,
+      "loss": 0.9297,
+      "step": 150
+    },
+    {
+      "epoch": 0.05,
+      "learning_rate": 4.993324780466081e-05,
+      "loss": 0.927,
+      "step": 160
+    },
+    {
+      "epoch": 0.05,
+      "learning_rate": 4.992447794951029e-05,
+      "loss": 0.9352,
+      "step": 170
+    },
+    {
+      "epoch": 0.05,
+      "learning_rate": 4.9915167869104006e-05,
+      "loss": 0.9244,
+      "step": 180
+    },
+    {
+      "epoch": 0.06,
+      "learning_rate": 4.990531776523317e-05,
+      "loss": 0.9185,
+      "step": 190
+    },
+    {
+      "epoch": 0.06,
+      "learning_rate": 4.9894927851393726e-05,
+      "loss": 0.9201,
+      "step": 200
+    },
+    {
+      "epoch": 0.06,
+      "learning_rate": 4.988399835278171e-05,
+      "loss": 0.9053,
+      "step": 210
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 4.987252950628839e-05,
+      "loss": 0.912,
+      "step": 220
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 4.986052156049513e-05,
+      "loss": 0.9013,
+      "step": 230
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 4.984797477566799e-05,
+      "loss": 0.8942,
+      "step": 240
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 4.9834889423752074e-05,
+      "loss": 0.8873,
+      "step": 250
+    },
+    {
+      "epoch": 0.08,
+      "learning_rate": 4.9821265788365664e-05,
+      "loss": 0.9036,
+      "step": 260
+    },
+    {
+      "epoch": 0.08,
+      "learning_rate": 4.980710416479407e-05,
+      "loss": 0.901,
+      "step": 270
+    },
+    {
+      "epoch": 0.08,
+      "learning_rate": 4.97924048599832e-05,
+      "loss": 0.8941,
+      "step": 280
+    },
+    {
+      "epoch": 0.09,
+      "learning_rate": 4.977716819253293e-05,
+      "loss": 0.8886,
+      "step": 290
+    },
+    {
+      "epoch": 0.09,
+      "learning_rate": 4.97613944926902e-05,
+      "loss": 0.8852,
+      "step": 300
+    },
+    {
+      "epoch": 0.09,
+      "learning_rate": 4.974508410234187e-05,
+      "loss": 0.8877,
+      "step": 310
+    },
+    {
+      "epoch": 0.09,
+      "learning_rate": 4.972823737500725e-05,
+      "loss": 0.8833,
+      "step": 320
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 4.971085467583051e-05,
+      "loss": 0.869,
+      "step": 330
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 4.969293638157273e-05,
+      "loss": 0.877,
+      "step": 340
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 4.967448288060372e-05,
+      "loss": 0.8793,
+      "step": 350
+    },
+    {
+      "epoch": 0.11,
+      "learning_rate": 4.9655494572893644e-05,
+      "loss": 0.8742,
+      "step": 360
+    },
+    {
+      "epoch": 0.11,
+      "learning_rate": 4.9635971870004316e-05,
+      "loss": 0.8774,
+      "step": 370
+    },
+    {
+      "epoch": 0.11,
+      "learning_rate": 4.961591519508029e-05,
+      "loss": 0.8682,
+      "step": 380
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 4.9595324982839686e-05,
+      "loss": 0.8581,
+      "step": 390
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 4.957420167956479e-05,
+      "loss": 0.868,
+      "step": 400
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 4.955254574309234e-05,
+      "loss": 0.8672,
+      "step": 410
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 4.9530357642803646e-05,
+      "loss": 0.8672,
+      "step": 420
+    },
+    {
+      "epoch": 0.13,
+      "learning_rate": 4.950763785961436e-05,
+      "loss": 0.867,
+      "step": 430
+    },
+    {
+      "epoch": 0.13,
+      "learning_rate": 4.948438688596414e-05,
+      "loss": 0.8612,
+      "step": 440
+    },
+    {
+      "epoch": 0.13,
+      "learning_rate": 4.946060522580588e-05,
+      "loss": 0.8607,
+      "step": 450
+    },
+    {
+      "epoch": 0.14,
+      "learning_rate": 4.943629339459484e-05,
+      "loss": 0.8588,
+      "step": 460
+    },
+    {
+      "epoch": 0.14,
+      "learning_rate": 4.9411451919277484e-05,
+      "loss": 0.8585,
+      "step": 470
+    },
+    {
+      "epoch": 0.14,
+      "learning_rate": 4.9386081338280035e-05,
+      "loss": 0.8574,
+      "step": 480
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 4.9360182201496785e-05,
+      "loss": 0.8562,
+      "step": 490
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 4.933375507027824e-05,
+      "loss": 0.8634,
+      "step": 500
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 4.930680051741887e-05,
+      "loss": 0.8483,
+      "step": 510
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 4.9279319127144775e-05,
+      "loss": 0.8559,
+      "step": 520
+    },
+    {
+      "epoch": 0.16,
+      "learning_rate": 4.9251311495100974e-05,
+      "loss": 0.8526,
+      "step": 530
+    },
+    {
+      "epoch": 0.16,
+      "learning_rate": 4.9222778228338506e-05,
+      "loss": 0.85,
+      "step": 540
+    },
+    {
+      "epoch": 0.16,
+      "learning_rate": 4.919371994530125e-05,
+      "loss": 0.8547,
+      "step": 550
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 4.9164137275812597e-05,
+      "loss": 0.8533,
+      "step": 560
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 4.913403086106167e-05,
+      "loss": 0.8431,
+      "step": 570
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 4.9103401353589585e-05,
+      "loss": 0.8346,
+      "step": 580
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 4.9072249417275164e-05,
+      "loss": 0.8448,
+      "step": 590
+    },
+    {
+      "epoch": 0.18,
+      "learning_rate": 4.9040575727320606e-05,
+      "loss": 0.8477,
+      "step": 600
+    },
+    {
+      "epoch": 0.18,
+      "learning_rate": 4.90083809702369e-05,
+      "loss": 0.8555,
+      "step": 610
+    },
+    {
+      "epoch": 0.18,
+      "learning_rate": 4.897566584382884e-05,
+      "loss": 0.8295,
+      "step": 620
+    },
+    {
+      "epoch": 0.19,
+      "learning_rate": 4.8942431057180015e-05,
+      "loss": 0.8359,
+      "step": 630
+    },
+    {
+      "epoch": 0.19,
+      "learning_rate": 4.890867733063733e-05,
+      "loss": 0.8521,
+      "step": 640
+    },
+    {
+      "epoch": 0.19,
+      "learning_rate": 4.887440539579547e-05,
+      "loss": 0.8349,
+      "step": 650
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 4.883961599548103e-05,
+      "loss": 0.8285,
+      "step": 660
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 4.8804309883736377e-05,
+      "loss": 0.831,
+      "step": 670
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 4.876848782580336e-05,
+      "loss": 0.8295,
+      "step": 680
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 4.873215059810666e-05,
+      "loss": 0.8406,
+      "step": 690
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 4.8695298988237035e-05,
+      "loss": 0.8456,
+      "step": 700
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 4.8657933794934205e-05,
+      "loss": 0.8218,
+      "step": 710
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 4.8620055828069535e-05,
+      "loss": 0.8424,
+      "step": 720
+    },
+    {
+      "epoch": 0.22,
+      "learning_rate": 4.858166590862849e-05,
+      "loss": 0.8258,
+      "step": 730
+    },
+    {
+      "epoch": 0.22,
+      "learning_rate": 4.854276486869287e-05,
+      "loss": 0.8352,
+      "step": 740
+    },
+    {
+      "epoch": 0.22,
+      "learning_rate": 4.850335355142272e-05,
+      "loss": 0.836,
+      "step": 750
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 4.846343281103809e-05,
+      "loss": 0.8388,
+      "step": 760
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 4.842300351280054e-05,
+      "loss": 0.8287,
+      "step": 770
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 4.8382066532994316e-05,
+      "loss": 0.8394,
+      "step": 780
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 4.834062275890745e-05,
+      "loss": 0.8253,
+      "step": 790
+    },
+    {
+      "epoch": 0.24,
+      "learning_rate": 4.829867308881244e-05,
+      "loss": 0.82,
+      "step": 800
+    },
+    {
+      "epoch": 0.24,
+      "learning_rate": 4.825621843194684e-05,
+      "loss": 0.8294,
+      "step": 810
+    },
+    {
+      "epoch": 0.24,
+      "learning_rate": 4.821325970849353e-05,
+      "loss": 0.8275,
+      "step": 820
+    },
+    {
+      "epoch": 0.25,
+      "learning_rate": 4.8169797849560764e-05,
+      "loss": 0.8129,
+      "step": 830
+    },
+    {
+      "epoch": 0.25,
+      "learning_rate": 4.812583379716202e-05,
+      "loss": 0.8215,
+      "step": 840
+    },
+    {
+      "epoch": 0.25,
+      "learning_rate": 4.8081368504195545e-05,
+      "loss": 0.84,
+      "step": 850
+    },
+    {
+      "epoch": 0.25,
+      "learning_rate": 4.803640293442373e-05,
+      "loss": 0.8246,
+      "step": 860
+    },
+    {
+      "epoch": 0.26,
+      "learning_rate": 4.799093806245218e-05,
+      "loss": 0.8179,
+      "step": 870
+    },
+    {
+      "epoch": 0.26,
+      "learning_rate": 4.7944974873708656e-05,
+      "loss": 0.8238,
+      "step": 880
+    },
+    {
+      "epoch": 0.26,
+      "learning_rate": 4.7898514364421655e-05,
+      "loss": 0.8327,
+      "step": 890
+    },
+    {
+      "epoch": 0.27,
+      "learning_rate": 4.785155754159886e-05,
+      "loss": 0.812,
+      "step": 900
+    },
+    {
+      "epoch": 0.27,
+      "learning_rate": 4.780410542300527e-05,
+      "loss": 0.8293,
+      "step": 910
+    },
+    {
+      "epoch": 0.27,
+      "learning_rate": 4.7756159037141185e-05,
+      "loss": 0.8266,
+      "step": 920
+    },
+    {
+      "epoch": 0.28,
+      "learning_rate": 4.7707719423219886e-05,
+      "loss": 0.8209,
+      "step": 930
+    },
+    {
+      "epoch": 0.28,
+      "learning_rate": 4.765878763114513e-05,
+      "loss": 0.8182,
+      "step": 940
+    },
+    {
+      "epoch": 0.28,
+      "learning_rate": 4.760936472148837e-05,
+      "loss": 0.8045,
+      "step": 950
+    },
+    {
+      "epoch": 0.28,
+      "learning_rate": 4.755945176546578e-05,
+      "loss": 0.8126,
+      "step": 960
+    },
+    {
+      "epoch": 0.29,
+      "learning_rate": 4.7509049844915036e-05,
+      "loss": 0.8201,
+      "step": 970
+    },
+    {
+      "epoch": 0.29,
+      "learning_rate": 4.7458160052271883e-05,
+      "loss": 0.8133,
+      "step": 980
+    },
+    {
+      "epoch": 0.29,
+      "learning_rate": 4.7406783490546434e-05,
+      "loss": 0.8157,
+      "step": 990
+    },
+    {
+      "epoch": 0.3,
+      "learning_rate": 4.735492127329928e-05,
+      "loss": 0.817,
+      "step": 1000
+    },
+    {
+      "epoch": 0.3,
+      "learning_rate": 4.7302574524617315e-05,
+      "loss": 0.8002,
+      "step": 1010
+    },
+    {
+      "epoch": 0.3,
+      "learning_rate": 4.724974437908944e-05,
+      "loss": 0.8281,
+      "step": 1020
+    },
+    {
+      "epoch": 0.31,
+      "learning_rate": 4.719643198178193e-05,
+      "loss": 0.8129,
+      "step": 1030
+    },
+    {
+      "epoch": 0.31,
+      "learning_rate": 4.71426384882136e-05,
+      "loss": 0.8125,
+      "step": 1040
+    },
+    {
+      "epoch": 0.31,
+      "learning_rate": 4.708836506433078e-05,
+      "loss": 0.8066,
+      "step": 1050
+    },
+    {
+      "epoch": 0.31,
+      "learning_rate": 4.7033612886482066e-05,
+      "loss": 0.8159,
+      "step": 1060
+    },
+    {
+      "epoch": 0.32,
+      "learning_rate": 4.697838314139278e-05,
+      "loss": 0.8288,
+      "step": 1070
+    },
+    {
+      "epoch": 0.32,
+      "learning_rate": 4.6922677026139275e-05,
+      "loss": 0.8175,
+      "step": 1080
+    },
+    {
+      "epoch": 0.32,
+      "learning_rate": 4.686649574812299e-05,
+      "loss": 0.8107,
+      "step": 1090
+    },
+    {
+      "epoch": 0.33,
+      "learning_rate": 4.680984052504426e-05,
+      "loss": 0.8127,
+      "step": 1100
+    },
+    {
+      "epoch": 0.33,
+      "learning_rate": 4.6752712584875935e-05,
+      "loss": 0.8023,
+      "step": 1110
+    },
+    {
+      "epoch": 0.33,
+      "learning_rate": 4.669511316583678e-05,
+      "loss": 0.8066,
+      "step": 1120
+    },
+    {
+      "epoch": 0.33,
+      "learning_rate": 4.663704351636461e-05,
+      "loss": 0.8069,
+      "step": 1130
+    },
+    {
+      "epoch": 0.34,
+      "learning_rate": 4.6578504895089245e-05,
+      "loss": 0.8129,
+      "step": 1140
+    },
+    {
+      "epoch": 0.34,
+      "learning_rate": 4.651949857080524e-05,
+      "loss": 0.8247,
+      "step": 1150
+    },
+    {
+      "epoch": 0.34,
+      "learning_rate": 4.6460025822444354e-05,
+      "loss": 0.8125,
+      "step": 1160
+    },
+    {
+      "epoch": 0.35,
+      "learning_rate": 4.640008793904785e-05,
+      "loss": 0.8141,
+      "step": 1170
+    },
+    {
+      "epoch": 0.35,
+      "learning_rate": 4.6339686219738576e-05,
+      "loss": 0.8066,
+      "step": 1180
+    },
+    {
+      "epoch": 0.35,
+      "learning_rate": 4.627882197369276e-05,
+      "loss": 0.8052,
+      "step": 1190
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 4.621749652011167e-05,
+      "loss": 0.8114,
+      "step": 1200
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 4.615571118819301e-05,
+      "loss": 0.8001,
+      "step": 1210
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 4.60934673171021e-05,
+      "loss": 0.7938,
+      "step": 1220
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 4.6030766255942884e-05,
+      "loss": 0.8107,
+      "step": 1230
+    },
+    {
+      "epoch": 0.37,
+      "learning_rate": 4.596760936372865e-05,
+      "loss": 0.8096,
+      "step": 1240
+    },
+    {
+      "epoch": 0.37,
+      "learning_rate": 4.5903998009352586e-05,
+      "loss": 0.8105,
+      "step": 1250
+    },
+    {
+      "epoch": 0.37,
+      "learning_rate": 4.583993357155813e-05,
+      "loss": 0.7995,
+      "step": 1260
+    },
+    {
+      "epoch": 0.38,
+      "learning_rate": 4.577541743890906e-05,
+      "loss": 0.8161,
+      "step": 1270
+    },
+    {
+      "epoch": 0.38,
+      "learning_rate": 4.571045100975941e-05,
+      "loss": 0.8003,
+      "step": 1280
+    },
+    {
+      "epoch": 0.38,
+      "learning_rate": 4.564503569222315e-05,
+      "loss": 0.8114,
+      "step": 1290
+    },
+    {
+      "epoch": 0.39,
+      "learning_rate": 4.5579172904143685e-05,
+      "loss": 0.8165,
+      "step": 1300
+    },
+    {
+      "epoch": 0.39,
+      "learning_rate": 4.551286407306312e-05,
+      "loss": 0.8022,
+      "step": 1310
+    },
+    {
+      "epoch": 0.39,
+      "learning_rate": 4.54461106361913e-05,
+      "loss": 0.8032,
+      "step": 1320
+    },
+    {
+      "epoch": 0.39,
+      "learning_rate": 4.5378914040374684e-05,
+      "loss": 0.8067,
+      "step": 1330
+    },
+    {
+      "epoch": 0.4,
+      "learning_rate": 4.531127574206496e-05,
+      "loss": 0.789,
+      "step": 1340
+    },
+    {
+      "epoch": 0.4,
+      "learning_rate": 4.524319720728749e-05,
+      "loss": 0.8139,
+      "step": 1350
+    },
+    {
+      "epoch": 0.4,
+      "learning_rate": 4.517467991160956e-05,
+      "loss": 0.805,
+      "step": 1360
+    },
+    {
+      "epoch": 0.41,
+      "learning_rate": 4.510572534010836e-05,
+      "loss": 0.8123,
+      "step": 1370
+    },
+    {
+      "epoch": 0.41,
+      "learning_rate": 4.5036334987338785e-05,
+      "loss": 0.7976,
+      "step": 1380
+    },
+    {
+      "epoch": 0.41,
+      "learning_rate": 4.4966510357301094e-05,
+      "loss": 0.813,
+      "step": 1390
+    },
+    {
+      "epoch": 0.41,
+      "learning_rate": 4.489625296340828e-05,
+      "loss": 0.7975,
+      "step": 1400
+    },
+    {
+      "epoch": 0.42,
+      "learning_rate": 4.4825564328453256e-05,
+      "loss": 0.7969,
+      "step": 1410
+    },
+    {
+      "epoch": 0.42,
+      "learning_rate": 4.4754445984575874e-05,
+      "loss": 0.8006,
+      "step": 1420
+    },
+    {
+      "epoch": 0.42,
+      "learning_rate": 4.4682899473229714e-05,
+      "loss": 0.8041,
+      "step": 1430
+    },
+    {
+      "epoch": 0.43,
+      "learning_rate": 4.461092634514863e-05,
+      "loss": 0.7998,
+      "step": 1440
+    },
+    {
+      "epoch": 0.43,
+      "learning_rate": 4.453852816031323e-05,
+      "loss": 0.8,
+      "step": 1450
+    },
+    {
+      "epoch": 0.43,
+      "learning_rate": 4.446570648791695e-05,
+      "loss": 0.7993,
+      "step": 1460
+    },
+    {
+      "epoch": 0.44,
+      "learning_rate": 4.439246290633216e-05,
+      "loss": 0.8113,
+      "step": 1470
+    },
+    {
+      "epoch": 0.44,
+      "learning_rate": 4.431879900307585e-05,
+      "loss": 0.8133,
+      "step": 1480
+    },
+    {
+      "epoch": 0.44,
+      "learning_rate": 4.4244716374775274e-05,
+      "loss": 0.7963,
+      "step": 1490
+    },
+    {
+      "epoch": 0.44,
+      "learning_rate": 4.4170216627133365e-05,
+      "loss": 0.8005,
+      "step": 1500
+    },
+    {
+      "epoch": 0.45,
+      "learning_rate": 4.409530137489386e-05,
+      "loss": 0.8016,
+      "step": 1510
+    },
+    {
+      "epoch": 0.45,
+      "learning_rate": 4.4019972241806384e-05,
+      "loss": 0.7858,
+      "step": 1520
+    },
+    {
+      "epoch": 0.45,
+      "learning_rate": 4.3944230860591194e-05,
+      "loss": 0.8009,
+      "step": 1530
+    },
+    {
+      "epoch": 0.46,
+      "learning_rate": 4.3868078872903814e-05,
+      "loss": 0.7929,
+      "step": 1540
+    },
+    {
+      "epoch": 0.46,
+      "learning_rate": 4.3791517929299466e-05,
+      "loss": 0.8065,
+      "step": 1550
+    },
+    {
+      "epoch": 0.46,
+      "learning_rate": 4.3714549689197265e-05,
+      "loss": 0.792,
+      "step": 1560
+    },
+    {
+      "epoch": 0.47,
+      "learning_rate": 4.363717582084428e-05,
+      "loss": 0.7965,
+      "step": 1570
+    },
+    {
+      "epoch": 0.47,
+      "learning_rate": 4.355939800127937e-05,
+      "loss": 0.8038,
+      "step": 1580
+    },
+    {
+      "epoch": 0.47,
+      "learning_rate": 4.34812179162968e-05,
+      "loss": 0.7816,
+      "step": 1590
+    },
+    {
+      "epoch": 0.47,
+      "learning_rate": 4.340263726040976e-05,
+      "loss": 0.8053,
+      "step": 1600
+    },
+    {
+      "epoch": 0.48,
+      "learning_rate": 4.3323657736813614e-05,
+      "loss": 0.8009,
+      "step": 1610
+    },
+    {
+      "epoch": 0.48,
+      "learning_rate": 4.324428105734893e-05,
+      "loss": 0.8003,
+      "step": 1620
+    },
+    {
+      "epoch": 0.48,
+      "learning_rate": 4.3164508942464495e-05,
+      "loss": 0.7973,
+      "step": 1630
+    },
+    {
+      "epoch": 0.49,
+      "learning_rate": 4.3084343121179896e-05,
+      "loss": 0.7851,
+      "step": 1640
+    },
+    {
+      "epoch": 0.49,
+      "learning_rate": 4.300378533104814e-05,
+      "loss": 0.7982,
+      "step": 1650
+    },
+    {
+      "epoch": 0.49,
+      "learning_rate": 4.292283731811794e-05,
+      "loss": 0.797,
+      "step": 1660
+    },
+    {
+      "epoch": 0.49,
+      "learning_rate": 4.284150083689589e-05,
+      "loss": 0.7974,
+      "step": 1670
+    },
+    {
+      "epoch": 0.5,
+      "learning_rate": 4.275977765030845e-05,
+      "loss": 0.79,
+      "step": 1680
+    },
+    {
+      "epoch": 0.5,
+      "learning_rate": 4.267766952966369e-05,
+      "loss": 0.7997,
+      "step": 1690
+    },
+    {
+      "epoch": 0.5,
+      "learning_rate": 4.259517825461296e-05,
+      "loss": 0.7949,
+      "step": 1700
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 4.2512305613112266e-05,
+      "loss": 0.8015,
+      "step": 1710
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 4.2429053401383545e-05,
+      "loss": 0.7989,
+      "step": 1720
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 4.234542342387571e-05,
+      "loss": 0.7897,
+      "step": 1730
+    },
+    {
+      "epoch": 0.52,
+      "learning_rate": 4.2261417493225565e-05,
+      "loss": 0.795,
+      "step": 1740
+    },
+    {
+      "epoch": 0.52,
+      "learning_rate": 4.2177037430218504e-05,
+      "loss": 0.8037,
+      "step": 1750
+    },
+    {
+      "epoch": 0.52,
+      "learning_rate": 4.209228506374906e-05,
+      "loss": 0.7814,
+      "step": 1760
+    },
+    {
+      "epoch": 0.52,
+      "learning_rate": 4.200716223078121e-05,
+      "loss": 0.7957,
+      "step": 1770
+    },
+    {
+      "epoch": 0.53,
+      "learning_rate": 4.192167077630865e-05,
+      "loss": 0.7884,
+      "step": 1780
+    },
+    {
+      "epoch": 0.53,
+      "learning_rate": 4.183581255331475e-05,
+      "loss": 0.8069,
+      "step": 1790
+    },
+    {
+      "epoch": 0.53,
+      "learning_rate": 4.174958942273235e-05,
+      "loss": 0.7946,
+      "step": 1800
+    },
+    {
+      "epoch": 0.54,
+      "learning_rate": 4.166300325340355e-05,
+      "loss": 0.8016,
+      "step": 1810
+    },
+    {
+      "epoch": 0.54,
+      "learning_rate": 4.157605592203908e-05,
+      "loss": 0.7806,
+      "step": 1820
+    },
+    {
+      "epoch": 0.54,
+      "learning_rate": 4.148874931317767e-05,
+      "loss": 0.7786,
+      "step": 1830
+    },
+    {
+      "epoch": 0.55,
+      "learning_rate": 4.140108531914522e-05,
+      "loss": 0.7817,
+      "step": 1840
+    },
+    {
+      "epoch": 0.55,
+      "learning_rate": 4.1313065840013775e-05,
+      "loss": 0.7922,
+      "step": 1850
+    },
+    {
+      "epoch": 0.55,
+      "learning_rate": 4.1224692783560333e-05,
+      "loss": 0.7761,
+      "step": 1860
+    },
+    {
+      "epoch": 0.55,
+      "learning_rate": 4.113596806522548e-05,
+      "loss": 0.7841,
+      "step": 1870
+    },
+    {
+      "epoch": 0.56,
+      "learning_rate": 4.104689360807193e-05,
+      "loss": 0.7983,
+      "step": 1880
+    },
+    {
+      "epoch": 0.56,
+      "learning_rate": 4.095747134274276e-05,
+      "loss": 0.7753,
+      "step": 1890
+    },
+    {
+      "epoch": 0.56,
+      "learning_rate": 4.086770320741965e-05,
+      "loss": 0.7905,
+      "step": 1900
+    },
+    {
+      "epoch": 0.57,
+      "learning_rate": 4.077759114778081e-05,
+      "loss": 0.7901,
+      "step": 1910
+    },
+    {
+      "epoch": 0.57,
+      "learning_rate": 4.068713711695885e-05,
+      "loss": 0.7834,
+      "step": 1920
+    },
+    {
+      "epoch": 0.57,
+      "learning_rate": 4.059634307549841e-05,
+      "loss": 0.7752,
+      "step": 1930
+    },
+    {
+      "epoch": 0.57,
+      "learning_rate": 4.0505210991313714e-05,
+      "loss": 0.7905,
+      "step": 1940
+    },
+    {
+      "epoch": 0.58,
+      "learning_rate": 4.0413742839645855e-05,
+      "loss": 0.7824,
+      "step": 1950
+    },
+    {
+      "epoch": 0.58,
+      "learning_rate": 4.032194060302005e-05,
+      "loss": 0.793,
+      "step": 1960
+    },
+    {
+      "epoch": 0.58,
+      "learning_rate": 4.02298062712026e-05,
+      "loss": 0.7911,
+      "step": 1970
+    },
+    {
+      "epoch": 0.59,
+      "learning_rate": 4.013734184115783e-05,
+      "loss": 0.7927,
+      "step": 1980
+    },
+    {
+      "epoch": 0.59,
+      "learning_rate": 4.004454931700475e-05,
+      "loss": 0.7827,
+      "step": 1990
+    },
+    {
+      "epoch": 0.59,
+      "learning_rate": 3.995143070997367e-05,
+      "loss": 0.785,
+      "step": 2000
+    }
+  ],
+  "max_steps": 6748,
+  "num_train_epochs": 2,
+  "total_flos": 3.5557245451365253e+18,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-2000/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5f710e8a04dbb33457b5b725adb1da191a7b05d7ab01f6ec60c73386df9d8286
+size 3277

checkpoint-3000/README.md ADDED Viewed

	@@ -0,0 +1,20 @@

+---
+library_name: peft
+---
+## Training procedure
+The following `bitsandbytes` quantization config was used during training:
+- load_in_8bit: False
+- load_in_4bit: True
+- llm_int8_threshold: 6.0
+- llm_int8_skip_modules: None
+- llm_int8_enable_fp32_cpu_offload: False
+- llm_int8_has_fp16_weight: False
+- bnb_4bit_quant_type: nf4
+- bnb_4bit_use_double_quant: True
+- bnb_4bit_compute_dtype: float16
+### Framework versions
+- PEFT 0.4.0

checkpoint-3000/adapter_config.json ADDED Viewed

	@@ -0,0 +1,21 @@

+{
+  "auto_mapping": null,
+  "base_model_name_or_path": "./Llama-2-7b-chat-hf",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 32.0,
+  "lora_dropout": 0.1,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 8,
+  "revision": null,
+  "target_modules": [
+    "q_proj",
+    "v_proj"
+  ],
+  "task_type": "CAUSAL_LM"
+}

checkpoint-3000/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e109a32722191825f7fd37340782fa97f952ac78cb7b0cf0af5dea4cc2def675
+size 16821197

checkpoint-3000/finetuning_args.json ADDED Viewed

	@@ -0,0 +1,16 @@

+{
+  "dpo_beta": 0.1,
+  "finetuning_type": "lora",
+  "lora_alpha": 32.0,
+  "lora_dropout": 0.1,
+  "lora_rank": 8,
+  "lora_target": [
+    "q_proj",
+    "v_proj"
+  ],
+  "name_module_trainable": "mlp",
+  "num_hidden_layers": 32,
+  "num_layer_trainable": 3,
+  "ppo_score_norm": false,
+  "resume_lora_training": true
+}

checkpoint-3000/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:327e7ccbef91d3577c56e4b964ba7122360817d77251e9f188ade4e19d0f9d81
+size 33661637

checkpoint-3000/rng_state_0.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6ffd433067ffc3c9ba6197fe7e985e7dbf5bf4c45d16aebc15c0d6c1592dffbd
+size 18679

checkpoint-3000/rng_state_1.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:314d9ccd56b7cb0d45f74255469e1f371307e223188ecf89dad105bc342ab3f2
+size 18679

checkpoint-3000/rng_state_2.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:909d6a7009763e37015c47c0f211343f0c6c4bd01582e874b492c5102c9fe1b3
+size 18679

checkpoint-3000/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ec6030f4053fdeb7a01f6f3c018d7de200dc3716f2199ce7205263f4fe56bb62
+size 627

checkpoint-3000/trainer_state.json ADDED Viewed

	@@ -0,0 +1,1816 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 0.8889547373879547,
+  "global_step": 3000,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.0,
+      "learning_rate": 4.9999729068921297e-05,
+      "loss": 1.369,
+      "step": 10
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 4.9998916281557476e-05,
+      "loss": 1.1704,
+      "step": 20
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 4.999772150012383e-05,
+      "loss": 1.131,
+      "step": 30
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 4.99958792440589e-05,
+      "loss": 1.0618,
+      "step": 40
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 4.999401536044942e-05,
+      "loss": 1.0539,
+      "step": 50
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 4.9991197949909295e-05,
+      "loss": 1.0157,
+      "step": 60
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 4.998783886799168e-05,
+      "loss": 1.0235,
+      "step": 70
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 4.998393818750294e-05,
+      "loss": 0.9841,
+      "step": 80
+    },
+    {
+      "epoch": 0.03,
+      "learning_rate": 4.9979495992988316e-05,
+      "loss": 0.9787,
+      "step": 90
+    },
+    {
+      "epoch": 0.03,
+      "learning_rate": 4.997451238073011e-05,
+      "loss": 0.9716,
+      "step": 100
+    },
+    {
+      "epoch": 0.03,
+      "learning_rate": 4.996898745874553e-05,
+      "loss": 0.9718,
+      "step": 110
+    },
+    {
+      "epoch": 0.04,
+      "learning_rate": 4.996292134678445e-05,
+      "loss": 0.9608,
+      "step": 120
+    },
+    {
+      "epoch": 0.04,
+      "learning_rate": 4.995631417632672e-05,
+      "loss": 0.9547,
+      "step": 130
+    },
+    {
+      "epoch": 0.04,
+      "learning_rate": 4.994916609057936e-05,
+      "loss": 0.959,
+      "step": 140
+    },
+    {
+      "epoch": 0.04,
+      "learning_rate": 4.9941477244473455e-05,
+      "loss": 0.9297,
+      "step": 150
+    },
+    {
+      "epoch": 0.05,
+      "learning_rate": 4.993324780466081e-05,
+      "loss": 0.927,
+      "step": 160
+    },
+    {
+      "epoch": 0.05,
+      "learning_rate": 4.992447794951029e-05,
+      "loss": 0.9352,
+      "step": 170
+    },
+    {
+      "epoch": 0.05,
+      "learning_rate": 4.9915167869104006e-05,
+      "loss": 0.9244,
+      "step": 180
+    },
+    {
+      "epoch": 0.06,
+      "learning_rate": 4.990531776523317e-05,
+      "loss": 0.9185,
+      "step": 190
+    },
+    {
+      "epoch": 0.06,
+      "learning_rate": 4.9894927851393726e-05,
+      "loss": 0.9201,
+      "step": 200
+    },
+    {
+      "epoch": 0.06,
+      "learning_rate": 4.988399835278171e-05,
+      "loss": 0.9053,
+      "step": 210
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 4.987252950628839e-05,
+      "loss": 0.912,
+      "step": 220
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 4.986052156049513e-05,
+      "loss": 0.9013,
+      "step": 230
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 4.984797477566799e-05,
+      "loss": 0.8942,
+      "step": 240
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 4.9834889423752074e-05,
+      "loss": 0.8873,
+      "step": 250
+    },
+    {
+      "epoch": 0.08,
+      "learning_rate": 4.9821265788365664e-05,
+      "loss": 0.9036,
+      "step": 260
+    },
+    {
+      "epoch": 0.08,
+      "learning_rate": 4.980710416479407e-05,
+      "loss": 0.901,
+      "step": 270
+    },
+    {
+      "epoch": 0.08,
+      "learning_rate": 4.97924048599832e-05,
+      "loss": 0.8941,
+      "step": 280
+    },
+    {
+      "epoch": 0.09,
+      "learning_rate": 4.977716819253293e-05,
+      "loss": 0.8886,
+      "step": 290
+    },
+    {
+      "epoch": 0.09,
+      "learning_rate": 4.97613944926902e-05,
+      "loss": 0.8852,
+      "step": 300
+    },
+    {
+      "epoch": 0.09,
+      "learning_rate": 4.974508410234187e-05,
+      "loss": 0.8877,
+      "step": 310
+    },
+    {
+      "epoch": 0.09,
+      "learning_rate": 4.972823737500725e-05,
+      "loss": 0.8833,
+      "step": 320
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 4.971085467583051e-05,
+      "loss": 0.869,
+      "step": 330
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 4.969293638157273e-05,
+      "loss": 0.877,
+      "step": 340
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 4.967448288060372e-05,
+      "loss": 0.8793,
+      "step": 350
+    },
+    {
+      "epoch": 0.11,
+      "learning_rate": 4.9655494572893644e-05,
+      "loss": 0.8742,
+      "step": 360
+    },
+    {
+      "epoch": 0.11,
+      "learning_rate": 4.9635971870004316e-05,
+      "loss": 0.8774,
+      "step": 370
+    },
+    {
+      "epoch": 0.11,
+      "learning_rate": 4.961591519508029e-05,
+      "loss": 0.8682,
+      "step": 380
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 4.9595324982839686e-05,
+      "loss": 0.8581,
+      "step": 390
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 4.957420167956479e-05,
+      "loss": 0.868,
+      "step": 400
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 4.955254574309234e-05,
+      "loss": 0.8672,
+      "step": 410
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 4.9530357642803646e-05,
+      "loss": 0.8672,
+      "step": 420
+    },
+    {
+      "epoch": 0.13,
+      "learning_rate": 4.950763785961436e-05,
+      "loss": 0.867,
+      "step": 430
+    },
+    {
+      "epoch": 0.13,
+      "learning_rate": 4.948438688596414e-05,
+      "loss": 0.8612,
+      "step": 440
+    },
+    {
+      "epoch": 0.13,
+      "learning_rate": 4.946060522580588e-05,
+      "loss": 0.8607,
+      "step": 450
+    },
+    {
+      "epoch": 0.14,
+      "learning_rate": 4.943629339459484e-05,
+      "loss": 0.8588,
+      "step": 460
+    },
+    {
+      "epoch": 0.14,
+      "learning_rate": 4.9411451919277484e-05,
+      "loss": 0.8585,
+      "step": 470
+    },
+    {
+      "epoch": 0.14,
+      "learning_rate": 4.9386081338280035e-05,
+      "loss": 0.8574,
+      "step": 480
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 4.9360182201496785e-05,
+      "loss": 0.8562,
+      "step": 490
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 4.933375507027824e-05,
+      "loss": 0.8634,
+      "step": 500
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 4.930680051741887e-05,
+      "loss": 0.8483,
+      "step": 510
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 4.9279319127144775e-05,
+      "loss": 0.8559,
+      "step": 520
+    },
+    {
+      "epoch": 0.16,
+      "learning_rate": 4.9251311495100974e-05,
+      "loss": 0.8526,
+      "step": 530
+    },
+    {
+      "epoch": 0.16,
+      "learning_rate": 4.9222778228338506e-05,
+      "loss": 0.85,
+      "step": 540
+    },
+    {
+      "epoch": 0.16,
+      "learning_rate": 4.919371994530125e-05,
+      "loss": 0.8547,
+      "step": 550
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 4.9164137275812597e-05,
+      "loss": 0.8533,
+      "step": 560
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 4.913403086106167e-05,
+      "loss": 0.8431,
+      "step": 570
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 4.9103401353589585e-05,
+      "loss": 0.8346,
+      "step": 580
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 4.9072249417275164e-05,
+      "loss": 0.8448,
+      "step": 590
+    },
+    {
+      "epoch": 0.18,
+      "learning_rate": 4.9040575727320606e-05,
+      "loss": 0.8477,
+      "step": 600
+    },
+    {
+      "epoch": 0.18,
+      "learning_rate": 4.90083809702369e-05,
+      "loss": 0.8555,
+      "step": 610
+    },
+    {
+      "epoch": 0.18,
+      "learning_rate": 4.897566584382884e-05,
+      "loss": 0.8295,
+      "step": 620
+    },
+    {
+      "epoch": 0.19,
+      "learning_rate": 4.8942431057180015e-05,
+      "loss": 0.8359,
+      "step": 630
+    },
+    {
+      "epoch": 0.19,
+      "learning_rate": 4.890867733063733e-05,
+      "loss": 0.8521,
+      "step": 640
+    },
+    {
+      "epoch": 0.19,
+      "learning_rate": 4.887440539579547e-05,
+      "loss": 0.8349,
+      "step": 650
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 4.883961599548103e-05,
+      "loss": 0.8285,
+      "step": 660
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 4.8804309883736377e-05,
+      "loss": 0.831,
+      "step": 670
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 4.876848782580336e-05,
+      "loss": 0.8295,
+      "step": 680
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 4.873215059810666e-05,
+      "loss": 0.8406,
+      "step": 690
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 4.8695298988237035e-05,
+      "loss": 0.8456,
+      "step": 700
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 4.8657933794934205e-05,
+      "loss": 0.8218,
+      "step": 710
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 4.8620055828069535e-05,
+      "loss": 0.8424,
+      "step": 720
+    },
+    {
+      "epoch": 0.22,
+      "learning_rate": 4.858166590862849e-05,
+      "loss": 0.8258,
+      "step": 730
+    },
+    {
+      "epoch": 0.22,
+      "learning_rate": 4.854276486869287e-05,
+      "loss": 0.8352,
+      "step": 740
+    },
+    {
+      "epoch": 0.22,
+      "learning_rate": 4.850335355142272e-05,
+      "loss": 0.836,
+      "step": 750
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 4.846343281103809e-05,
+      "loss": 0.8388,
+      "step": 760
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 4.842300351280054e-05,
+      "loss": 0.8287,
+      "step": 770
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 4.8382066532994316e-05,
+      "loss": 0.8394,
+      "step": 780
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 4.834062275890745e-05,
+      "loss": 0.8253,
+      "step": 790
+    },
+    {
+      "epoch": 0.24,
+      "learning_rate": 4.829867308881244e-05,
+      "loss": 0.82,
+      "step": 800
+    },
+    {
+      "epoch": 0.24,
+      "learning_rate": 4.825621843194684e-05,
+      "loss": 0.8294,
+      "step": 810
+    },
+    {
+      "epoch": 0.24,
+      "learning_rate": 4.821325970849353e-05,
+      "loss": 0.8275,
+      "step": 820
+    },
+    {
+      "epoch": 0.25,
+      "learning_rate": 4.8169797849560764e-05,
+      "loss": 0.8129,
+      "step": 830
+    },
+    {
+      "epoch": 0.25,
+      "learning_rate": 4.812583379716202e-05,
+      "loss": 0.8215,
+      "step": 840
+    },
+    {
+      "epoch": 0.25,
+      "learning_rate": 4.8081368504195545e-05,
+      "loss": 0.84,
+      "step": 850
+    },
+    {
+      "epoch": 0.25,
+      "learning_rate": 4.803640293442373e-05,
+      "loss": 0.8246,
+      "step": 860
+    },
+    {
+      "epoch": 0.26,
+      "learning_rate": 4.799093806245218e-05,
+      "loss": 0.8179,
+      "step": 870
+    },
+    {
+      "epoch": 0.26,
+      "learning_rate": 4.7944974873708656e-05,
+      "loss": 0.8238,
+      "step": 880
+    },
+    {
+      "epoch": 0.26,
+      "learning_rate": 4.7898514364421655e-05,
+      "loss": 0.8327,
+      "step": 890
+    },
+    {
+      "epoch": 0.27,
+      "learning_rate": 4.785155754159886e-05,
+      "loss": 0.812,
+      "step": 900
+    },
+    {
+      "epoch": 0.27,
+      "learning_rate": 4.780410542300527e-05,
+      "loss": 0.8293,
+      "step": 910
+    },
+    {
+      "epoch": 0.27,
+      "learning_rate": 4.7756159037141185e-05,
+      "loss": 0.8266,
+      "step": 920
+    },
+    {
+      "epoch": 0.28,
+      "learning_rate": 4.7707719423219886e-05,
+      "loss": 0.8209,
+      "step": 930
+    },
+    {
+      "epoch": 0.28,
+      "learning_rate": 4.765878763114513e-05,
+      "loss": 0.8182,
+      "step": 940
+    },
+    {
+      "epoch": 0.28,
+      "learning_rate": 4.760936472148837e-05,
+      "loss": 0.8045,
+      "step": 950
+    },
+    {
+      "epoch": 0.28,
+      "learning_rate": 4.755945176546578e-05,
+      "loss": 0.8126,
+      "step": 960
+    },
+    {
+      "epoch": 0.29,
+      "learning_rate": 4.7509049844915036e-05,
+      "loss": 0.8201,
+      "step": 970
+    },
+    {
+      "epoch": 0.29,
+      "learning_rate": 4.7458160052271883e-05,
+      "loss": 0.8133,
+      "step": 980
+    },
+    {
+      "epoch": 0.29,
+      "learning_rate": 4.7406783490546434e-05,
+      "loss": 0.8157,
+      "step": 990
+    },
+    {
+      "epoch": 0.3,
+      "learning_rate": 4.735492127329928e-05,
+      "loss": 0.817,
+      "step": 1000
+    },
+    {
+      "epoch": 0.3,
+      "learning_rate": 4.7302574524617315e-05,
+      "loss": 0.8002,
+      "step": 1010
+    },
+    {
+      "epoch": 0.3,
+      "learning_rate": 4.724974437908944e-05,
+      "loss": 0.8281,
+      "step": 1020
+    },
+    {
+      "epoch": 0.31,
+      "learning_rate": 4.719643198178193e-05,
+      "loss": 0.8129,
+      "step": 1030
+    },
+    {
+      "epoch": 0.31,
+      "learning_rate": 4.71426384882136e-05,
+      "loss": 0.8125,
+      "step": 1040
+    },
+    {
+      "epoch": 0.31,
+      "learning_rate": 4.708836506433078e-05,
+      "loss": 0.8066,
+      "step": 1050
+    },
+    {
+      "epoch": 0.31,
+      "learning_rate": 4.7033612886482066e-05,
+      "loss": 0.8159,
+      "step": 1060
+    },
+    {
+      "epoch": 0.32,
+      "learning_rate": 4.697838314139278e-05,
+      "loss": 0.8288,
+      "step": 1070
+    },
+    {
+      "epoch": 0.32,
+      "learning_rate": 4.6922677026139275e-05,
+      "loss": 0.8175,
+      "step": 1080
+    },
+    {
+      "epoch": 0.32,
+      "learning_rate": 4.686649574812299e-05,
+      "loss": 0.8107,
+      "step": 1090
+    },
+    {
+      "epoch": 0.33,
+      "learning_rate": 4.680984052504426e-05,
+      "loss": 0.8127,
+      "step": 1100
+    },
+    {
+      "epoch": 0.33,
+      "learning_rate": 4.6752712584875935e-05,
+      "loss": 0.8023,
+      "step": 1110
+    },
+    {
+      "epoch": 0.33,
+      "learning_rate": 4.669511316583678e-05,
+      "loss": 0.8066,
+      "step": 1120
+    },
+    {
+      "epoch": 0.33,
+      "learning_rate": 4.663704351636461e-05,
+      "loss": 0.8069,
+      "step": 1130
+    },
+    {
+      "epoch": 0.34,
+      "learning_rate": 4.6578504895089245e-05,
+      "loss": 0.8129,
+      "step": 1140
+    },
+    {
+      "epoch": 0.34,
+      "learning_rate": 4.651949857080524e-05,
+      "loss": 0.8247,
+      "step": 1150
+    },
+    {
+      "epoch": 0.34,
+      "learning_rate": 4.6460025822444354e-05,
+      "loss": 0.8125,
+      "step": 1160
+    },
+    {
+      "epoch": 0.35,
+      "learning_rate": 4.640008793904785e-05,
+      "loss": 0.8141,
+      "step": 1170
+    },
+    {
+      "epoch": 0.35,
+      "learning_rate": 4.6339686219738576e-05,
+      "loss": 0.8066,
+      "step": 1180
+    },
+    {
+      "epoch": 0.35,
+      "learning_rate": 4.627882197369276e-05,
+      "loss": 0.8052,
+      "step": 1190
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 4.621749652011167e-05,
+      "loss": 0.8114,
+      "step": 1200
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 4.615571118819301e-05,
+      "loss": 0.8001,
+      "step": 1210
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 4.60934673171021e-05,
+      "loss": 0.7938,
+      "step": 1220
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 4.6030766255942884e-05,
+      "loss": 0.8107,
+      "step": 1230
+    },
+    {
+      "epoch": 0.37,
+      "learning_rate": 4.596760936372865e-05,
+      "loss": 0.8096,
+      "step": 1240
+    },
+    {
+      "epoch": 0.37,
+      "learning_rate": 4.5903998009352586e-05,
+      "loss": 0.8105,
+      "step": 1250
+    },
+    {
+      "epoch": 0.37,
+      "learning_rate": 4.583993357155813e-05,
+      "loss": 0.7995,
+      "step": 1260
+    },
+    {
+      "epoch": 0.38,
+      "learning_rate": 4.577541743890906e-05,
+      "loss": 0.8161,
+      "step": 1270
+    },
+    {
+      "epoch": 0.38,
+      "learning_rate": 4.571045100975941e-05,
+      "loss": 0.8003,
+      "step": 1280
+    },
+    {
+      "epoch": 0.38,
+      "learning_rate": 4.564503569222315e-05,
+      "loss": 0.8114,
+      "step": 1290
+    },
+    {
+      "epoch": 0.39,
+      "learning_rate": 4.5579172904143685e-05,
+      "loss": 0.8165,
+      "step": 1300
+    },
+    {
+      "epoch": 0.39,
+      "learning_rate": 4.551286407306312e-05,
+      "loss": 0.8022,
+      "step": 1310
+    },
+    {
+      "epoch": 0.39,
+      "learning_rate": 4.54461106361913e-05,
+      "loss": 0.8032,
+      "step": 1320
+    },
+    {
+      "epoch": 0.39,
+      "learning_rate": 4.5378914040374684e-05,
+      "loss": 0.8067,
+      "step": 1330
+    },
+    {
+      "epoch": 0.4,
+      "learning_rate": 4.531127574206496e-05,
+      "loss": 0.789,
+      "step": 1340
+    },
+    {
+      "epoch": 0.4,
+      "learning_rate": 4.524319720728749e-05,
+      "loss": 0.8139,
+      "step": 1350
+    },
+    {
+      "epoch": 0.4,
+      "learning_rate": 4.517467991160956e-05,
+      "loss": 0.805,
+      "step": 1360
+    },
+    {
+      "epoch": 0.41,
+      "learning_rate": 4.510572534010836e-05,
+      "loss": 0.8123,
+      "step": 1370
+    },
+    {
+      "epoch": 0.41,
+      "learning_rate": 4.5036334987338785e-05,
+      "loss": 0.7976,
+      "step": 1380
+    },
+    {
+      "epoch": 0.41,
+      "learning_rate": 4.4966510357301094e-05,
+      "loss": 0.813,
+      "step": 1390
+    },
+    {
+      "epoch": 0.41,
+      "learning_rate": 4.489625296340828e-05,
+      "loss": 0.7975,
+      "step": 1400
+    },
+    {
+      "epoch": 0.42,
+      "learning_rate": 4.4825564328453256e-05,
+      "loss": 0.7969,
+      "step": 1410
+    },
+    {
+      "epoch": 0.42,
+      "learning_rate": 4.4754445984575874e-05,
+      "loss": 0.8006,
+      "step": 1420
+    },
+    {
+      "epoch": 0.42,
+      "learning_rate": 4.4682899473229714e-05,
+      "loss": 0.8041,
+      "step": 1430
+    },
+    {
+      "epoch": 0.43,
+      "learning_rate": 4.461092634514863e-05,
+      "loss": 0.7998,
+      "step": 1440
+    },
+    {
+      "epoch": 0.43,
+      "learning_rate": 4.453852816031323e-05,
+      "loss": 0.8,
+      "step": 1450
+    },
+    {
+      "epoch": 0.43,
+      "learning_rate": 4.446570648791695e-05,
+      "loss": 0.7993,
+      "step": 1460
+    },
+    {
+      "epoch": 0.44,
+      "learning_rate": 4.439246290633216e-05,
+      "loss": 0.8113,
+      "step": 1470
+    },
+    {
+      "epoch": 0.44,
+      "learning_rate": 4.431879900307585e-05,
+      "loss": 0.8133,
+      "step": 1480
+    },
+    {
+      "epoch": 0.44,
+      "learning_rate": 4.4244716374775274e-05,
+      "loss": 0.7963,
+      "step": 1490
+    },
+    {
+      "epoch": 0.44,
+      "learning_rate": 4.4170216627133365e-05,
+      "loss": 0.8005,
+      "step": 1500
+    },
+    {
+      "epoch": 0.45,
+      "learning_rate": 4.409530137489386e-05,
+      "loss": 0.8016,
+      "step": 1510
+    },
+    {
+      "epoch": 0.45,
+      "learning_rate": 4.4019972241806384e-05,
+      "loss": 0.7858,
+      "step": 1520
+    },
+    {
+      "epoch": 0.45,
+      "learning_rate": 4.3944230860591194e-05,
+      "loss": 0.8009,
+      "step": 1530
+    },
+    {
+      "epoch": 0.46,
+      "learning_rate": 4.3868078872903814e-05,
+      "loss": 0.7929,
+      "step": 1540
+    },
+    {
+      "epoch": 0.46,
+      "learning_rate": 4.3791517929299466e-05,
+      "loss": 0.8065,
+      "step": 1550
+    },
+    {
+      "epoch": 0.46,
+      "learning_rate": 4.3714549689197265e-05,
+      "loss": 0.792,
+      "step": 1560
+    },
+    {
+      "epoch": 0.47,
+      "learning_rate": 4.363717582084428e-05,
+      "loss": 0.7965,
+      "step": 1570
+    },
+    {
+      "epoch": 0.47,
+      "learning_rate": 4.355939800127937e-05,
+      "loss": 0.8038,
+      "step": 1580
+    },
+    {
+      "epoch": 0.47,
+      "learning_rate": 4.34812179162968e-05,
+      "loss": 0.7816,
+      "step": 1590
+    },
+    {
+      "epoch": 0.47,
+      "learning_rate": 4.340263726040976e-05,
+      "loss": 0.8053,
+      "step": 1600
+    },
+    {
+      "epoch": 0.48,
+      "learning_rate": 4.3323657736813614e-05,
+      "loss": 0.8009,
+      "step": 1610
+    },
+    {
+      "epoch": 0.48,
+      "learning_rate": 4.324428105734893e-05,
+      "loss": 0.8003,
+      "step": 1620
+    },
+    {
+      "epoch": 0.48,
+      "learning_rate": 4.3164508942464495e-05,
+      "loss": 0.7973,
+      "step": 1630
+    },
+    {
+      "epoch": 0.49,
+      "learning_rate": 4.3084343121179896e-05,
+      "loss": 0.7851,
+      "step": 1640
+    },
+    {
+      "epoch": 0.49,
+      "learning_rate": 4.300378533104814e-05,
+      "loss": 0.7982,
+      "step": 1650
+    },
+    {
+      "epoch": 0.49,
+      "learning_rate": 4.292283731811794e-05,
+      "loss": 0.797,
+      "step": 1660
+    },
+    {
+      "epoch": 0.49,
+      "learning_rate": 4.284150083689589e-05,
+      "loss": 0.7974,
+      "step": 1670
+    },
+    {
+      "epoch": 0.5,
+      "learning_rate": 4.275977765030845e-05,
+      "loss": 0.79,
+      "step": 1680
+    },
+    {
+      "epoch": 0.5,
+      "learning_rate": 4.267766952966369e-05,
+      "loss": 0.7997,
+      "step": 1690
+    },
+    {
+      "epoch": 0.5,
+      "learning_rate": 4.259517825461296e-05,
+      "loss": 0.7949,
+      "step": 1700
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 4.2512305613112266e-05,
+      "loss": 0.8015,
+      "step": 1710
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 4.2429053401383545e-05,
+      "loss": 0.7989,
+      "step": 1720
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 4.234542342387571e-05,
+      "loss": 0.7897,
+      "step": 1730
+    },
+    {
+      "epoch": 0.52,
+      "learning_rate": 4.2261417493225565e-05,
+      "loss": 0.795,
+      "step": 1740
+    },
+    {
+      "epoch": 0.52,
+      "learning_rate": 4.2177037430218504e-05,
+      "loss": 0.8037,
+      "step": 1750
+    },
+    {
+      "epoch": 0.52,
+      "learning_rate": 4.209228506374906e-05,
+      "loss": 0.7814,
+      "step": 1760
+    },
+    {
+      "epoch": 0.52,
+      "learning_rate": 4.200716223078121e-05,
+      "loss": 0.7957,
+      "step": 1770
+    },
+    {
+      "epoch": 0.53,
+      "learning_rate": 4.192167077630865e-05,
+      "loss": 0.7884,
+      "step": 1780
+    },
+    {
+      "epoch": 0.53,
+      "learning_rate": 4.183581255331475e-05,
+      "loss": 0.8069,
+      "step": 1790
+    },
+    {
+      "epoch": 0.53,
+      "learning_rate": 4.174958942273235e-05,
+      "loss": 0.7946,
+      "step": 1800
+    },
+    {
+      "epoch": 0.54,
+      "learning_rate": 4.166300325340355e-05,
+      "loss": 0.8016,
+      "step": 1810
+    },
+    {
+      "epoch": 0.54,
+      "learning_rate": 4.157605592203908e-05,
+      "loss": 0.7806,
+      "step": 1820
+    },
+    {
+      "epoch": 0.54,
+      "learning_rate": 4.148874931317767e-05,
+      "loss": 0.7786,
+      "step": 1830
+    },
+    {
+      "epoch": 0.55,
+      "learning_rate": 4.140108531914522e-05,
+      "loss": 0.7817,
+      "step": 1840
+    },
+    {
+      "epoch": 0.55,
+      "learning_rate": 4.1313065840013775e-05,
+      "loss": 0.7922,
+      "step": 1850
+    },
+    {
+      "epoch": 0.55,
+      "learning_rate": 4.1224692783560333e-05,
+      "loss": 0.7761,
+      "step": 1860
+    },
+    {
+      "epoch": 0.55,
+      "learning_rate": 4.113596806522548e-05,
+      "loss": 0.7841,
+      "step": 1870
+    },
+    {
+      "epoch": 0.56,
+      "learning_rate": 4.104689360807193e-05,
+      "loss": 0.7983,
+      "step": 1880
+    },
+    {
+      "epoch": 0.56,
+      "learning_rate": 4.095747134274276e-05,
+      "loss": 0.7753,
+      "step": 1890
+    },
+    {
+      "epoch": 0.56,
+      "learning_rate": 4.086770320741965e-05,
+      "loss": 0.7905,
+      "step": 1900
+    },
+    {
+      "epoch": 0.57,
+      "learning_rate": 4.077759114778081e-05,
+      "loss": 0.7901,
+      "step": 1910
+    },
+    {
+      "epoch": 0.57,
+      "learning_rate": 4.068713711695885e-05,
+      "loss": 0.7834,
+      "step": 1920
+    },
+    {
+      "epoch": 0.57,
+      "learning_rate": 4.059634307549841e-05,
+      "loss": 0.7752,
+      "step": 1930
+    },
+    {
+      "epoch": 0.57,
+      "learning_rate": 4.0505210991313714e-05,
+      "loss": 0.7905,
+      "step": 1940
+    },
+    {
+      "epoch": 0.58,
+      "learning_rate": 4.0413742839645855e-05,
+      "loss": 0.7824,
+      "step": 1950
+    },
+    {
+      "epoch": 0.58,
+      "learning_rate": 4.032194060302005e-05,
+      "loss": 0.793,
+      "step": 1960
+    },
+    {
+      "epoch": 0.58,
+      "learning_rate": 4.02298062712026e-05,
+      "loss": 0.7911,
+      "step": 1970
+    },
+    {
+      "epoch": 0.59,
+      "learning_rate": 4.013734184115783e-05,
+      "loss": 0.7927,
+      "step": 1980
+    },
+    {
+      "epoch": 0.59,
+      "learning_rate": 4.004454931700475e-05,
+      "loss": 0.7827,
+      "step": 1990
+    },
+    {
+      "epoch": 0.59,
+      "learning_rate": 3.995143070997367e-05,
+      "loss": 0.785,
+      "step": 2000
+    },
+    {
+      "epoch": 0.6,
+      "learning_rate": 3.985798803836256e-05,
+      "loss": 0.7922,
+      "step": 2010
+    },
+    {
+      "epoch": 0.6,
+      "learning_rate": 3.976422332749331e-05,
+      "loss": 0.7969,
+      "step": 2020
+    },
+    {
+      "epoch": 0.6,
+      "learning_rate": 3.967013860966787e-05,
+      "loss": 0.7801,
+      "step": 2030
+    },
+    {
+      "epoch": 0.6,
+      "learning_rate": 3.957573592412417e-05,
+      "loss": 0.7876,
+      "step": 2040
+    },
+    {
+      "epoch": 0.61,
+      "learning_rate": 3.948101731699192e-05,
+      "loss": 0.7862,
+      "step": 2050
+    },
+    {
+      "epoch": 0.61,
+      "learning_rate": 3.938598484124827e-05,
+      "loss": 0.7855,
+      "step": 2060
+    },
+    {
+      "epoch": 0.61,
+      "learning_rate": 3.929064055667333e-05,
+      "loss": 0.7917,
+      "step": 2070
+    },
+    {
+      "epoch": 0.62,
+      "learning_rate": 3.919498652980546e-05,
+      "loss": 0.7855,
+      "step": 2080
+    },
+    {
+      "epoch": 0.62,
+      "learning_rate": 3.909902483389658e-05,
+      "loss": 0.7641,
+      "step": 2090
+    },
+    {
+      "epoch": 0.62,
+      "learning_rate": 3.900275754886714e-05,
+      "loss": 0.784,
+      "step": 2100
+    },
+    {
+      "epoch": 0.63,
+      "learning_rate": 3.8906186761261095e-05,
+      "loss": 0.7745,
+      "step": 2110
+    },
+    {
+      "epoch": 0.63,
+      "learning_rate": 3.880931456420066e-05,
+      "loss": 0.7913,
+      "step": 2120
+    },
+    {
+      "epoch": 0.63,
+      "learning_rate": 3.8712143057340935e-05,
+      "loss": 0.7823,
+      "step": 2130
+    },
+    {
+      "epoch": 0.63,
+      "learning_rate": 3.861467434682442e-05,
+      "loss": 0.7834,
+      "step": 2140
+    },
+    {
+      "epoch": 0.64,
+      "learning_rate": 3.851691054523534e-05,
+      "loss": 0.7929,
+      "step": 2150
+    },
+    {
+      "epoch": 0.64,
+      "learning_rate": 3.841885377155388e-05,
+      "loss": 0.7751,
+      "step": 2160
+    },
+    {
+      "epoch": 0.64,
+      "learning_rate": 3.832050615111023e-05,
+      "loss": 0.7814,
+      "step": 2170
+    },
+    {
+      "epoch": 0.65,
+      "learning_rate": 3.8221869815538544e-05,
+      "loss": 0.7833,
+      "step": 2180
+    },
+    {
+      "epoch": 0.65,
+      "learning_rate": 3.812294690273074e-05,
+      "loss": 0.7829,
+      "step": 2190
+    },
+    {
+      "epoch": 0.65,
+      "learning_rate": 3.802373955679011e-05,
+      "loss": 0.773,
+      "step": 2200
+    },
+    {
+      "epoch": 0.65,
+      "learning_rate": 3.7924249927984936e-05,
+      "loss": 0.7827,
+      "step": 2210
+    },
+    {
+      "epoch": 0.66,
+      "learning_rate": 3.78244801727018e-05,
+      "loss": 0.7863,
+      "step": 2220
+    },
+    {
+      "epoch": 0.66,
+      "learning_rate": 3.77244324533989e-05,
+      "loss": 0.7881,
+      "step": 2230
+    },
+    {
+      "epoch": 0.66,
+      "learning_rate": 3.762410893855916e-05,
+      "loss": 0.7889,
+      "step": 2240
+    },
+    {
+      "epoch": 0.67,
+      "learning_rate": 3.752351180264323e-05,
+      "loss": 0.7754,
+      "step": 2250
+    },
+    {
+      "epoch": 0.67,
+      "learning_rate": 3.7422643226042344e-05,
+      "loss": 0.7815,
+      "step": 2260
+    },
+    {
+      "epoch": 0.67,
+      "learning_rate": 3.732150539503109e-05,
+      "loss": 0.7749,
+      "step": 2270
+    },
+    {
+      "epoch": 0.68,
+      "learning_rate": 3.722010050172e-05,
+      "loss": 0.7686,
+      "step": 2280
+    },
+    {
+      "epoch": 0.68,
+      "learning_rate": 3.711843074400805e-05,
+      "loss": 0.7918,
+      "step": 2290
+    },
+    {
+      "epoch": 0.68,
+      "learning_rate": 3.701649832553499e-05,
+      "loss": 0.7779,
+      "step": 2300
+    },
+    {
+      "epoch": 0.68,
+      "learning_rate": 3.691430545563365e-05,
+      "loss": 0.7677,
+      "step": 2310
+    },
+    {
+      "epoch": 0.69,
+      "learning_rate": 3.6811854349281984e-05,
+      "loss": 0.7758,
+      "step": 2320
+    },
+    {
+      "epoch": 0.69,
+      "learning_rate": 3.670914722705508e-05,
+      "loss": 0.7635,
+      "step": 2330
+    },
+    {
+      "epoch": 0.69,
+      "learning_rate": 3.660618631507706e-05,
+      "loss": 0.7778,
+      "step": 2340
+    },
+    {
+      "epoch": 0.7,
+      "learning_rate": 3.6502973844972806e-05,
+      "loss": 0.772,
+      "step": 2350
+    },
+    {
+      "epoch": 0.7,
+      "learning_rate": 3.6399512053819574e-05,
+      "loss": 0.7747,
+      "step": 2360
+    },
+    {
+      "epoch": 0.7,
+      "learning_rate": 3.6295803184098546e-05,
+      "loss": 0.7956,
+      "step": 2370
+    },
+    {
+      "epoch": 0.71,
+      "learning_rate": 3.619184948364619e-05,
+      "loss": 0.7699,
+      "step": 2380
+    },
+    {
+      "epoch": 0.71,
+      "learning_rate": 3.608765320560558e-05,
+      "loss": 0.7876,
+      "step": 2390
+    },
+    {
+      "epoch": 0.71,
+      "learning_rate": 3.59832166083775e-05,
+      "loss": 0.7778,
+      "step": 2400
+    },
+    {
+      "epoch": 0.71,
+      "learning_rate": 3.587854195557156e-05,
+      "loss": 0.7911,
+      "step": 2410
+    },
+    {
+      "epoch": 0.72,
+      "learning_rate": 3.577363151595706e-05,
+      "loss": 0.7856,
+      "step": 2420
+    },
+    {
+      "epoch": 0.72,
+      "learning_rate": 3.566848756341391e-05,
+      "loss": 0.7818,
+      "step": 2430
+    },
+    {
+      "epoch": 0.72,
+      "learning_rate": 3.556311237688327e-05,
+      "loss": 0.7754,
+      "step": 2440
+    },
+    {
+      "epoch": 0.73,
+      "learning_rate": 3.545750824031816e-05,
+      "loss": 0.7958,
+      "step": 2450
+    },
+    {
+      "epoch": 0.73,
+      "learning_rate": 3.535167744263401e-05,
+      "loss": 0.777,
+      "step": 2460
+    },
+    {
+      "epoch": 0.73,
+      "learning_rate": 3.524562227765897e-05,
+      "loss": 0.7774,
+      "step": 2470
+    },
+    {
+      "epoch": 0.73,
+      "learning_rate": 3.5139345044084284e-05,
+      "loss": 0.782,
+      "step": 2480
+    },
+    {
+      "epoch": 0.74,
+      "learning_rate": 3.503284804541438e-05,
+      "loss": 0.7888,
+      "step": 2490
+    },
+    {
+      "epoch": 0.74,
+      "learning_rate": 3.492613358991701e-05,
+      "loss": 0.7684,
+      "step": 2500
+    },
+    {
+      "epoch": 0.74,
+      "learning_rate": 3.481920399057316e-05,
+      "loss": 0.7783,
+      "step": 2510
+    },
+    {
+      "epoch": 0.75,
+      "learning_rate": 3.471206156502698e-05,
+      "loss": 0.7706,
+      "step": 2520
+    },
+    {
+      "epoch": 0.75,
+      "learning_rate": 3.460470863553549e-05,
+      "loss": 0.7739,
+      "step": 2530
+    },
+    {
+      "epoch": 0.75,
+      "learning_rate": 3.449714752891829e-05,
+      "loss": 0.7786,
+      "step": 2540
+    },
+    {
+      "epoch": 0.76,
+      "learning_rate": 3.4389380576507136e-05,
+      "loss": 0.7641,
+      "step": 2550
+    },
+    {
+      "epoch": 0.76,
+      "learning_rate": 3.428141011409534e-05,
+      "loss": 0.7723,
+      "step": 2560
+    },
+    {
+      "epoch": 0.76,
+      "learning_rate": 3.417323848188721e-05,
+      "loss": 0.7827,
+      "step": 2570
+    },
+    {
+      "epoch": 0.76,
+      "learning_rate": 3.406486802444731e-05,
+      "loss": 0.7714,
+      "step": 2580
+    },
+    {
+      "epoch": 0.77,
+      "learning_rate": 3.395630109064963e-05,
+      "loss": 0.7785,
+      "step": 2590
+    },
+    {
+      "epoch": 0.77,
+      "learning_rate": 3.38475400336267e-05,
+      "loss": 0.7715,
+      "step": 2600
+    },
+    {
+      "epoch": 0.77,
+      "learning_rate": 3.3738587210718555e-05,
+      "loss": 0.7736,
+      "step": 2610
+    },
+    {
+      "epoch": 0.78,
+      "learning_rate": 3.362944498342165e-05,
+      "loss": 0.7679,
+      "step": 2620
+    },
+    {
+      "epoch": 0.78,
+      "learning_rate": 3.352011571733772e-05,
+      "loss": 0.7754,
+      "step": 2630
+    },
+    {
+      "epoch": 0.78,
+      "learning_rate": 3.341060178212242e-05,
+      "loss": 0.786,
+      "step": 2640
+    },
+    {
+      "epoch": 0.79,
+      "learning_rate": 3.330090555143405e-05,
+      "loss": 0.7873,
+      "step": 2650
+    },
+    {
+      "epoch": 0.79,
+      "learning_rate": 3.319102940288206e-05,
+      "loss": 0.7699,
+      "step": 2660
+    },
+    {
+      "epoch": 0.79,
+      "learning_rate": 3.308097571797552e-05,
+      "loss": 0.7627,
+      "step": 2670
+    },
+    {
+      "epoch": 0.79,
+      "learning_rate": 3.297074688207152e-05,
+      "loss": 0.7803,
+      "step": 2680
+    },
+    {
+      "epoch": 0.8,
+      "learning_rate": 3.286034528432345e-05,
+      "loss": 0.78,
+      "step": 2690
+    },
+    {
+      "epoch": 0.8,
+      "learning_rate": 3.274977331762923e-05,
+      "loss": 0.7549,
+      "step": 2700
+    },
+    {
+      "epoch": 0.8,
+      "learning_rate": 3.2639033378579445e-05,
+      "loss": 0.7679,
+      "step": 2710
+    },
+    {
+      "epoch": 0.81,
+      "learning_rate": 3.252812786740537e-05,
+      "loss": 0.7708,
+      "step": 2720
+    },
+    {
+      "epoch": 0.81,
+      "learning_rate": 3.241705918792699e-05,
+      "loss": 0.7662,
+      "step": 2730
+    },
+    {
+      "epoch": 0.81,
+      "learning_rate": 3.230582974750088e-05,
+      "loss": 0.7705,
+      "step": 2740
+    },
+    {
+      "epoch": 0.81,
+      "learning_rate": 3.2194441956968036e-05,
+      "loss": 0.7762,
+      "step": 2750
+    },
+    {
+      "epoch": 0.82,
+      "learning_rate": 3.2082898230601574e-05,
+      "loss": 0.7689,
+      "step": 2760
+    },
+    {
+      "epoch": 0.82,
+      "learning_rate": 3.1971200986054476e-05,
+      "loss": 0.7834,
+      "step": 2770
+    },
+    {
+      "epoch": 0.82,
+      "learning_rate": 3.185935264430714e-05,
+      "loss": 0.7784,
+      "step": 2780
+    },
+    {
+      "epoch": 0.83,
+      "learning_rate": 3.174735562961491e-05,
+      "loss": 0.7749,
+      "step": 2790
+    },
+    {
+      "epoch": 0.83,
+      "learning_rate": 3.1635212369455535e-05,
+      "loss": 0.7776,
+      "step": 2800
+    },
+    {
+      "epoch": 0.83,
+      "learning_rate": 3.15229252944766e-05,
+      "loss": 0.7708,
+      "step": 2810
+    },
+    {
+      "epoch": 0.84,
+      "learning_rate": 3.141049683844275e-05,
+      "loss": 0.7655,
+      "step": 2820
+    },
+    {
+      "epoch": 0.84,
+      "learning_rate": 3.129792943818303e-05,
+      "loss": 0.774,
+      "step": 2830
+    },
+    {
+      "epoch": 0.84,
+      "learning_rate": 3.118522553353799e-05,
+      "loss": 0.7577,
+      "step": 2840
+    },
+    {
+      "epoch": 0.84,
+      "learning_rate": 3.107238756730689e-05,
+      "loss": 0.7657,
+      "step": 2850
+    },
+    {
+      "epoch": 0.85,
+      "learning_rate": 3.095941798519468e-05,
+      "loss": 0.7783,
+      "step": 2860
+    },
+    {
+      "epoch": 0.85,
+      "learning_rate": 3.084631923575901e-05,
+      "loss": 0.7655,
+      "step": 2870
+    },
+    {
+      "epoch": 0.85,
+      "learning_rate": 3.0733093770357194e-05,
+      "loss": 0.7708,
+      "step": 2880
+    },
+    {
+      "epoch": 0.86,
+      "learning_rate": 3.0619744043093e-05,
+      "loss": 0.7671,
+      "step": 2890
+    },
+    {
+      "epoch": 0.86,
+      "learning_rate": 3.0506272510763557e-05,
+      "loss": 0.7774,
+      "step": 2900
+    },
+    {
+      "epoch": 0.86,
+      "learning_rate": 3.0392681632806036e-05,
+      "loss": 0.77,
+      "step": 2910
+    },
+    {
+      "epoch": 0.87,
+      "learning_rate": 3.0278973871244366e-05,
+      "loss": 0.7754,
+      "step": 2920
+    },
+    {
+      "epoch": 0.87,
+      "learning_rate": 3.0165151690635855e-05,
+      "loss": 0.7837,
+      "step": 2930
+    },
+    {
+      "epoch": 0.87,
+      "learning_rate": 3.0051217558017812e-05,
+      "loss": 0.7769,
+      "step": 2940
+    },
+    {
+      "epoch": 0.87,
+      "learning_rate": 2.993717394285403e-05,
+      "loss": 0.7568,
+      "step": 2950
+    },
+    {
+      "epoch": 0.88,
+      "learning_rate": 2.982302331698128e-05,
+      "loss": 0.7774,
+      "step": 2960
+    },
+    {
+      "epoch": 0.88,
+      "learning_rate": 2.9708768154555732e-05,
+      "loss": 0.7629,
+      "step": 2970
+    },
+    {
+      "epoch": 0.88,
+      "learning_rate": 2.959441093199935e-05,
+      "loss": 0.7679,
+      "step": 2980
+    },
+    {
+      "epoch": 0.89,
+      "learning_rate": 2.9479954127946187e-05,
+      "loss": 0.772,
+      "step": 2990
+    },
+    {
+      "epoch": 0.89,
+      "learning_rate": 2.936540022318866e-05,
+      "loss": 0.7806,
+      "step": 3000
+    }
+  ],
+  "max_steps": 6748,
+  "num_train_epochs": 2,
+  "total_flos": 5.337713347120857e+18,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-3000/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5f710e8a04dbb33457b5b725adb1da191a7b05d7ab01f6ec60c73386df9d8286
+size 3277

checkpoint-4000/README.md ADDED Viewed

	@@ -0,0 +1,20 @@

+---
+library_name: peft
+---
+## Training procedure
+The following `bitsandbytes` quantization config was used during training:
+- load_in_8bit: False
+- load_in_4bit: True
+- llm_int8_threshold: 6.0
+- llm_int8_skip_modules: None
+- llm_int8_enable_fp32_cpu_offload: False
+- llm_int8_has_fp16_weight: False
+- bnb_4bit_quant_type: nf4
+- bnb_4bit_use_double_quant: True
+- bnb_4bit_compute_dtype: float16
+### Framework versions
+- PEFT 0.4.0

checkpoint-4000/adapter_config.json ADDED Viewed

	@@ -0,0 +1,21 @@

+{
+  "auto_mapping": null,
+  "base_model_name_or_path": "./Llama-2-7b-chat-hf",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 32.0,
+  "lora_dropout": 0.1,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 8,
+  "revision": null,
+  "target_modules": [
+    "q_proj",
+    "v_proj"
+  ],
+  "task_type": "CAUSAL_LM"
+}

checkpoint-4000/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a7bf1845cc6e68aa0579e5e88808550297fa08d24fb8a35cb0e38ebc16755731
+size 16821197

checkpoint-4000/finetuning_args.json ADDED Viewed

	@@ -0,0 +1,16 @@

+{
+  "dpo_beta": 0.1,
+  "finetuning_type": "lora",
+  "lora_alpha": 32.0,
+  "lora_dropout": 0.1,
+  "lora_rank": 8,
+  "lora_target": [
+    "q_proj",
+    "v_proj"
+  ],
+  "name_module_trainable": "mlp",
+  "num_hidden_layers": 32,
+  "num_layer_trainable": 3,
+  "ppo_score_norm": false,
+  "resume_lora_training": true
+}

checkpoint-4000/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7f6cb6eb009a6909453a9696bb0e774d7db6df702514b5010c8141e067ed851a
+size 33661637

checkpoint-4000/rng_state_0.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ffd8c2ce4f590d406989075063816ceb18c656ea870887898bccf20b75bdbd77
+size 18679

checkpoint-4000/rng_state_1.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:45689d820d74708b258149c47a789bd97e2300a6ac6fe54628e4f301b8c12364
+size 18679

checkpoint-4000/rng_state_2.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:62a32f853241a440561897c7f8f79f93e194ff2580a7fe9cc1a18cb0d1a4c5a8
+size 18679

checkpoint-4000/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:03e00f5f20dfa01cb13a6cde7397bf7d6d9693e36851f5c15779c6f2e63250c2
+size 627

checkpoint-4000/trainer_state.json ADDED Viewed

	@@ -0,0 +1,2416 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 1.1852729831839395,
+  "global_step": 4000,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.0,
+      "learning_rate": 4.9999729068921297e-05,
+      "loss": 1.369,
+      "step": 10
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 4.9998916281557476e-05,
+      "loss": 1.1704,
+      "step": 20
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 4.999772150012383e-05,
+      "loss": 1.131,
+      "step": 30
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 4.99958792440589e-05,
+      "loss": 1.0618,
+      "step": 40
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 4.999401536044942e-05,
+      "loss": 1.0539,
+      "step": 50
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 4.9991197949909295e-05,
+      "loss": 1.0157,
+      "step": 60
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 4.998783886799168e-05,
+      "loss": 1.0235,
+      "step": 70
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 4.998393818750294e-05,
+      "loss": 0.9841,
+      "step": 80
+    },
+    {
+      "epoch": 0.03,
+      "learning_rate": 4.9979495992988316e-05,
+      "loss": 0.9787,
+      "step": 90
+    },
+    {
+      "epoch": 0.03,
+      "learning_rate": 4.997451238073011e-05,
+      "loss": 0.9716,
+      "step": 100
+    },
+    {
+      "epoch": 0.03,
+      "learning_rate": 4.996898745874553e-05,
+      "loss": 0.9718,
+      "step": 110
+    },
+    {
+      "epoch": 0.04,
+      "learning_rate": 4.996292134678445e-05,
+      "loss": 0.9608,
+      "step": 120
+    },
+    {
+      "epoch": 0.04,
+      "learning_rate": 4.995631417632672e-05,
+      "loss": 0.9547,
+      "step": 130
+    },
+    {
+      "epoch": 0.04,
+      "learning_rate": 4.994916609057936e-05,
+      "loss": 0.959,
+      "step": 140
+    },
+    {
+      "epoch": 0.04,
+      "learning_rate": 4.9941477244473455e-05,
+      "loss": 0.9297,
+      "step": 150
+    },
+    {
+      "epoch": 0.05,
+      "learning_rate": 4.993324780466081e-05,
+      "loss": 0.927,
+      "step": 160
+    },
+    {
+      "epoch": 0.05,
+      "learning_rate": 4.992447794951029e-05,
+      "loss": 0.9352,
+      "step": 170
+    },
+    {
+      "epoch": 0.05,
+      "learning_rate": 4.9915167869104006e-05,
+      "loss": 0.9244,
+      "step": 180
+    },
+    {
+      "epoch": 0.06,
+      "learning_rate": 4.990531776523317e-05,
+      "loss": 0.9185,
+      "step": 190
+    },
+    {
+      "epoch": 0.06,
+      "learning_rate": 4.9894927851393726e-05,
+      "loss": 0.9201,
+      "step": 200
+    },
+    {
+      "epoch": 0.06,
+      "learning_rate": 4.988399835278171e-05,
+      "loss": 0.9053,
+      "step": 210
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 4.987252950628839e-05,
+      "loss": 0.912,
+      "step": 220
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 4.986052156049513e-05,
+      "loss": 0.9013,
+      "step": 230
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 4.984797477566799e-05,
+      "loss": 0.8942,
+      "step": 240
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 4.9834889423752074e-05,
+      "loss": 0.8873,
+      "step": 250
+    },
+    {
+      "epoch": 0.08,
+      "learning_rate": 4.9821265788365664e-05,
+      "loss": 0.9036,
+      "step": 260
+    },
+    {
+      "epoch": 0.08,
+      "learning_rate": 4.980710416479407e-05,
+      "loss": 0.901,
+      "step": 270
+    },
+    {
+      "epoch": 0.08,
+      "learning_rate": 4.97924048599832e-05,
+      "loss": 0.8941,
+      "step": 280
+    },
+    {
+      "epoch": 0.09,
+      "learning_rate": 4.977716819253293e-05,
+      "loss": 0.8886,
+      "step": 290
+    },
+    {
+      "epoch": 0.09,
+      "learning_rate": 4.97613944926902e-05,
+      "loss": 0.8852,
+      "step": 300
+    },
+    {
+      "epoch": 0.09,
+      "learning_rate": 4.974508410234187e-05,
+      "loss": 0.8877,
+      "step": 310
+    },
+    {
+      "epoch": 0.09,
+      "learning_rate": 4.972823737500725e-05,
+      "loss": 0.8833,
+      "step": 320
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 4.971085467583051e-05,
+      "loss": 0.869,
+      "step": 330
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 4.969293638157273e-05,
+      "loss": 0.877,
+      "step": 340
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 4.967448288060372e-05,
+      "loss": 0.8793,
+      "step": 350
+    },
+    {
+      "epoch": 0.11,
+      "learning_rate": 4.9655494572893644e-05,
+      "loss": 0.8742,
+      "step": 360
+    },
+    {
+      "epoch": 0.11,
+      "learning_rate": 4.9635971870004316e-05,
+      "loss": 0.8774,
+      "step": 370
+    },
+    {
+      "epoch": 0.11,
+      "learning_rate": 4.961591519508029e-05,
+      "loss": 0.8682,
+      "step": 380
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 4.9595324982839686e-05,
+      "loss": 0.8581,
+      "step": 390
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 4.957420167956479e-05,
+      "loss": 0.868,
+      "step": 400
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 4.955254574309234e-05,
+      "loss": 0.8672,
+      "step": 410
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 4.9530357642803646e-05,
+      "loss": 0.8672,
+      "step": 420
+    },
+    {
+      "epoch": 0.13,
+      "learning_rate": 4.950763785961436e-05,
+      "loss": 0.867,
+      "step": 430
+    },
+    {
+      "epoch": 0.13,
+      "learning_rate": 4.948438688596414e-05,
+      "loss": 0.8612,
+      "step": 440
+    },
+    {
+      "epoch": 0.13,
+      "learning_rate": 4.946060522580588e-05,
+      "loss": 0.8607,
+      "step": 450
+    },
+    {
+      "epoch": 0.14,
+      "learning_rate": 4.943629339459484e-05,
+      "loss": 0.8588,
+      "step": 460
+    },
+    {
+      "epoch": 0.14,
+      "learning_rate": 4.9411451919277484e-05,
+      "loss": 0.8585,
+      "step": 470
+    },
+    {
+      "epoch": 0.14,
+      "learning_rate": 4.9386081338280035e-05,
+      "loss": 0.8574,
+      "step": 480
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 4.9360182201496785e-05,
+      "loss": 0.8562,
+      "step": 490
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 4.933375507027824e-05,
+      "loss": 0.8634,
+      "step": 500
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 4.930680051741887e-05,
+      "loss": 0.8483,
+      "step": 510
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 4.9279319127144775e-05,
+      "loss": 0.8559,
+      "step": 520
+    },
+    {
+      "epoch": 0.16,
+      "learning_rate": 4.9251311495100974e-05,
+      "loss": 0.8526,
+      "step": 530
+    },
+    {
+      "epoch": 0.16,
+      "learning_rate": 4.9222778228338506e-05,
+      "loss": 0.85,
+      "step": 540
+    },
+    {
+      "epoch": 0.16,
+      "learning_rate": 4.919371994530125e-05,
+      "loss": 0.8547,
+      "step": 550
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 4.9164137275812597e-05,
+      "loss": 0.8533,
+      "step": 560
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 4.913403086106167e-05,
+      "loss": 0.8431,
+      "step": 570
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 4.9103401353589585e-05,
+      "loss": 0.8346,
+      "step": 580
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 4.9072249417275164e-05,
+      "loss": 0.8448,
+      "step": 590
+    },
+    {
+      "epoch": 0.18,
+      "learning_rate": 4.9040575727320606e-05,
+      "loss": 0.8477,
+      "step": 600
+    },
+    {
+      "epoch": 0.18,
+      "learning_rate": 4.90083809702369e-05,
+      "loss": 0.8555,
+      "step": 610
+    },
+    {
+      "epoch": 0.18,
+      "learning_rate": 4.897566584382884e-05,
+      "loss": 0.8295,
+      "step": 620
+    },
+    {
+      "epoch": 0.19,
+      "learning_rate": 4.8942431057180015e-05,
+      "loss": 0.8359,
+      "step": 630
+    },
+    {
+      "epoch": 0.19,
+      "learning_rate": 4.890867733063733e-05,
+      "loss": 0.8521,
+      "step": 640
+    },
+    {
+      "epoch": 0.19,
+      "learning_rate": 4.887440539579547e-05,
+      "loss": 0.8349,
+      "step": 650
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 4.883961599548103e-05,
+      "loss": 0.8285,
+      "step": 660
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 4.8804309883736377e-05,
+      "loss": 0.831,
+      "step": 670
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 4.876848782580336e-05,
+      "loss": 0.8295,
+      "step": 680
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 4.873215059810666e-05,
+      "loss": 0.8406,
+      "step": 690
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 4.8695298988237035e-05,
+      "loss": 0.8456,
+      "step": 700
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 4.8657933794934205e-05,
+      "loss": 0.8218,
+      "step": 710
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 4.8620055828069535e-05,
+      "loss": 0.8424,
+      "step": 720
+    },
+    {
+      "epoch": 0.22,
+      "learning_rate": 4.858166590862849e-05,
+      "loss": 0.8258,
+      "step": 730
+    },
+    {
+      "epoch": 0.22,
+      "learning_rate": 4.854276486869287e-05,
+      "loss": 0.8352,
+      "step": 740
+    },
+    {
+      "epoch": 0.22,
+      "learning_rate": 4.850335355142272e-05,
+      "loss": 0.836,
+      "step": 750
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 4.846343281103809e-05,
+      "loss": 0.8388,
+      "step": 760
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 4.842300351280054e-05,
+      "loss": 0.8287,
+      "step": 770
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 4.8382066532994316e-05,
+      "loss": 0.8394,
+      "step": 780
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 4.834062275890745e-05,
+      "loss": 0.8253,
+      "step": 790
+    },
+    {
+      "epoch": 0.24,
+      "learning_rate": 4.829867308881244e-05,
+      "loss": 0.82,
+      "step": 800
+    },
+    {
+      "epoch": 0.24,
+      "learning_rate": 4.825621843194684e-05,
+      "loss": 0.8294,
+      "step": 810
+    },
+    {
+      "epoch": 0.24,
+      "learning_rate": 4.821325970849353e-05,
+      "loss": 0.8275,
+      "step": 820
+    },
+    {
+      "epoch": 0.25,
+      "learning_rate": 4.8169797849560764e-05,
+      "loss": 0.8129,
+      "step": 830
+    },
+    {
+      "epoch": 0.25,
+      "learning_rate": 4.812583379716202e-05,
+      "loss": 0.8215,
+      "step": 840
+    },
+    {
+      "epoch": 0.25,
+      "learning_rate": 4.8081368504195545e-05,
+      "loss": 0.84,
+      "step": 850
+    },
+    {
+      "epoch": 0.25,
+      "learning_rate": 4.803640293442373e-05,
+      "loss": 0.8246,
+      "step": 860
+    },
+    {
+      "epoch": 0.26,
+      "learning_rate": 4.799093806245218e-05,
+      "loss": 0.8179,
+      "step": 870
+    },
+    {
+      "epoch": 0.26,
+      "learning_rate": 4.7944974873708656e-05,
+      "loss": 0.8238,
+      "step": 880
+    },
+    {
+      "epoch": 0.26,
+      "learning_rate": 4.7898514364421655e-05,
+      "loss": 0.8327,
+      "step": 890
+    },
+    {
+      "epoch": 0.27,
+      "learning_rate": 4.785155754159886e-05,
+      "loss": 0.812,
+      "step": 900
+    },
+    {
+      "epoch": 0.27,
+      "learning_rate": 4.780410542300527e-05,
+      "loss": 0.8293,
+      "step": 910
+    },
+    {
+      "epoch": 0.27,
+      "learning_rate": 4.7756159037141185e-05,
+      "loss": 0.8266,
+      "step": 920
+    },
+    {
+      "epoch": 0.28,
+      "learning_rate": 4.7707719423219886e-05,
+      "loss": 0.8209,
+      "step": 930
+    },
+    {
+      "epoch": 0.28,
+      "learning_rate": 4.765878763114513e-05,
+      "loss": 0.8182,
+      "step": 940
+    },
+    {
+      "epoch": 0.28,
+      "learning_rate": 4.760936472148837e-05,
+      "loss": 0.8045,
+      "step": 950
+    },
+    {
+      "epoch": 0.28,
+      "learning_rate": 4.755945176546578e-05,
+      "loss": 0.8126,
+      "step": 960
+    },
+    {
+      "epoch": 0.29,
+      "learning_rate": 4.7509049844915036e-05,
+      "loss": 0.8201,
+      "step": 970
+    },
+    {
+      "epoch": 0.29,
+      "learning_rate": 4.7458160052271883e-05,
+      "loss": 0.8133,
+      "step": 980
+    },
+    {
+      "epoch": 0.29,
+      "learning_rate": 4.7406783490546434e-05,
+      "loss": 0.8157,
+      "step": 990
+    },
+    {
+      "epoch": 0.3,
+      "learning_rate": 4.735492127329928e-05,
+      "loss": 0.817,
+      "step": 1000
+    },
+    {
+      "epoch": 0.3,
+      "learning_rate": 4.7302574524617315e-05,
+      "loss": 0.8002,
+      "step": 1010
+    },
+    {
+      "epoch": 0.3,
+      "learning_rate": 4.724974437908944e-05,
+      "loss": 0.8281,
+      "step": 1020
+    },
+    {
+      "epoch": 0.31,
+      "learning_rate": 4.719643198178193e-05,
+      "loss": 0.8129,
+      "step": 1030
+    },
+    {
+      "epoch": 0.31,
+      "learning_rate": 4.71426384882136e-05,
+      "loss": 0.8125,
+      "step": 1040
+    },
+    {
+      "epoch": 0.31,
+      "learning_rate": 4.708836506433078e-05,
+      "loss": 0.8066,
+      "step": 1050
+    },
+    {
+      "epoch": 0.31,
+      "learning_rate": 4.7033612886482066e-05,
+      "loss": 0.8159,
+      "step": 1060
+    },
+    {
+      "epoch": 0.32,
+      "learning_rate": 4.697838314139278e-05,
+      "loss": 0.8288,
+      "step": 1070
+    },
+    {
+      "epoch": 0.32,
+      "learning_rate": 4.6922677026139275e-05,
+      "loss": 0.8175,
+      "step": 1080
+    },
+    {
+      "epoch": 0.32,
+      "learning_rate": 4.686649574812299e-05,
+      "loss": 0.8107,
+      "step": 1090
+    },
+    {
+      "epoch": 0.33,
+      "learning_rate": 4.680984052504426e-05,
+      "loss": 0.8127,
+      "step": 1100
+    },
+    {
+      "epoch": 0.33,
+      "learning_rate": 4.6752712584875935e-05,
+      "loss": 0.8023,
+      "step": 1110
+    },
+    {
+      "epoch": 0.33,
+      "learning_rate": 4.669511316583678e-05,
+      "loss": 0.8066,
+      "step": 1120
+    },
+    {
+      "epoch": 0.33,
+      "learning_rate": 4.663704351636461e-05,
+      "loss": 0.8069,
+      "step": 1130
+    },
+    {
+      "epoch": 0.34,
+      "learning_rate": 4.6578504895089245e-05,
+      "loss": 0.8129,
+      "step": 1140
+    },
+    {
+      "epoch": 0.34,
+      "learning_rate": 4.651949857080524e-05,
+      "loss": 0.8247,
+      "step": 1150
+    },
+    {
+      "epoch": 0.34,
+      "learning_rate": 4.6460025822444354e-05,
+      "loss": 0.8125,
+      "step": 1160
+    },
+    {
+      "epoch": 0.35,
+      "learning_rate": 4.640008793904785e-05,
+      "loss": 0.8141,
+      "step": 1170
+    },
+    {
+      "epoch": 0.35,
+      "learning_rate": 4.6339686219738576e-05,
+      "loss": 0.8066,
+      "step": 1180
+    },
+    {
+      "epoch": 0.35,
+      "learning_rate": 4.627882197369276e-05,
+      "loss": 0.8052,
+      "step": 1190
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 4.621749652011167e-05,
+      "loss": 0.8114,
+      "step": 1200
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 4.615571118819301e-05,
+      "loss": 0.8001,
+      "step": 1210
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 4.60934673171021e-05,
+      "loss": 0.7938,
+      "step": 1220
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 4.6030766255942884e-05,
+      "loss": 0.8107,
+      "step": 1230
+    },
+    {
+      "epoch": 0.37,
+      "learning_rate": 4.596760936372865e-05,
+      "loss": 0.8096,
+      "step": 1240
+    },
+    {
+      "epoch": 0.37,
+      "learning_rate": 4.5903998009352586e-05,
+      "loss": 0.8105,
+      "step": 1250
+    },
+    {
+      "epoch": 0.37,
+      "learning_rate": 4.583993357155813e-05,
+      "loss": 0.7995,
+      "step": 1260
+    },
+    {
+      "epoch": 0.38,
+      "learning_rate": 4.577541743890906e-05,
+      "loss": 0.8161,
+      "step": 1270
+    },
+    {
+      "epoch": 0.38,
+      "learning_rate": 4.571045100975941e-05,
+      "loss": 0.8003,
+      "step": 1280
+    },
+    {
+      "epoch": 0.38,
+      "learning_rate": 4.564503569222315e-05,
+      "loss": 0.8114,
+      "step": 1290
+    },
+    {
+      "epoch": 0.39,
+      "learning_rate": 4.5579172904143685e-05,
+      "loss": 0.8165,
+      "step": 1300
+    },
+    {
+      "epoch": 0.39,
+      "learning_rate": 4.551286407306312e-05,
+      "loss": 0.8022,
+      "step": 1310
+    },
+    {
+      "epoch": 0.39,
+      "learning_rate": 4.54461106361913e-05,
+      "loss": 0.8032,
+      "step": 1320
+    },
+    {
+      "epoch": 0.39,
+      "learning_rate": 4.5378914040374684e-05,
+      "loss": 0.8067,
+      "step": 1330
+    },
+    {
+      "epoch": 0.4,
+      "learning_rate": 4.531127574206496e-05,
+      "loss": 0.789,
+      "step": 1340
+    },
+    {
+      "epoch": 0.4,
+      "learning_rate": 4.524319720728749e-05,
+      "loss": 0.8139,
+      "step": 1350
+    },
+    {
+      "epoch": 0.4,
+      "learning_rate": 4.517467991160956e-05,
+      "loss": 0.805,
+      "step": 1360
+    },
+    {
+      "epoch": 0.41,
+      "learning_rate": 4.510572534010836e-05,
+      "loss": 0.8123,
+      "step": 1370
+    },
+    {
+      "epoch": 0.41,
+      "learning_rate": 4.5036334987338785e-05,
+      "loss": 0.7976,
+      "step": 1380
+    },
+    {
+      "epoch": 0.41,
+      "learning_rate": 4.4966510357301094e-05,
+      "loss": 0.813,
+      "step": 1390
+    },
+    {
+      "epoch": 0.41,
+      "learning_rate": 4.489625296340828e-05,
+      "loss": 0.7975,
+      "step": 1400
+    },
+    {
+      "epoch": 0.42,
+      "learning_rate": 4.4825564328453256e-05,
+      "loss": 0.7969,
+      "step": 1410
+    },
+    {
+      "epoch": 0.42,
+      "learning_rate": 4.4754445984575874e-05,
+      "loss": 0.8006,
+      "step": 1420
+    },
+    {
+      "epoch": 0.42,
+      "learning_rate": 4.4682899473229714e-05,
+      "loss": 0.8041,
+      "step": 1430
+    },
+    {
+      "epoch": 0.43,
+      "learning_rate": 4.461092634514863e-05,
+      "loss": 0.7998,
+      "step": 1440
+    },
+    {
+      "epoch": 0.43,
+      "learning_rate": 4.453852816031323e-05,
+      "loss": 0.8,
+      "step": 1450
+    },
+    {
+      "epoch": 0.43,
+      "learning_rate": 4.446570648791695e-05,
+      "loss": 0.7993,
+      "step": 1460
+    },
+    {
+      "epoch": 0.44,
+      "learning_rate": 4.439246290633216e-05,
+      "loss": 0.8113,
+      "step": 1470
+    },
+    {
+      "epoch": 0.44,
+      "learning_rate": 4.431879900307585e-05,
+      "loss": 0.8133,
+      "step": 1480
+    },
+    {
+      "epoch": 0.44,
+      "learning_rate": 4.4244716374775274e-05,
+      "loss": 0.7963,
+      "step": 1490
+    },
+    {
+      "epoch": 0.44,
+      "learning_rate": 4.4170216627133365e-05,
+      "loss": 0.8005,
+      "step": 1500
+    },
+    {
+      "epoch": 0.45,
+      "learning_rate": 4.409530137489386e-05,
+      "loss": 0.8016,
+      "step": 1510
+    },
+    {
+      "epoch": 0.45,
+      "learning_rate": 4.4019972241806384e-05,
+      "loss": 0.7858,
+      "step": 1520
+    },
+    {
+      "epoch": 0.45,
+      "learning_rate": 4.3944230860591194e-05,
+      "loss": 0.8009,
+      "step": 1530
+    },
+    {
+      "epoch": 0.46,
+      "learning_rate": 4.3868078872903814e-05,
+      "loss": 0.7929,
+      "step": 1540
+    },
+    {
+      "epoch": 0.46,
+      "learning_rate": 4.3791517929299466e-05,
+      "loss": 0.8065,
+      "step": 1550
+    },
+    {
+      "epoch": 0.46,
+      "learning_rate": 4.3714549689197265e-05,
+      "loss": 0.792,
+      "step": 1560
+    },
+    {
+      "epoch": 0.47,
+      "learning_rate": 4.363717582084428e-05,
+      "loss": 0.7965,
+      "step": 1570
+    },
+    {
+      "epoch": 0.47,
+      "learning_rate": 4.355939800127937e-05,
+      "loss": 0.8038,
+      "step": 1580
+    },
+    {
+      "epoch": 0.47,
+      "learning_rate": 4.34812179162968e-05,
+      "loss": 0.7816,
+      "step": 1590
+    },
+    {
+      "epoch": 0.47,
+      "learning_rate": 4.340263726040976e-05,
+      "loss": 0.8053,
+      "step": 1600
+    },
+    {
+      "epoch": 0.48,
+      "learning_rate": 4.3323657736813614e-05,
+      "loss": 0.8009,
+      "step": 1610
+    },
+    {
+      "epoch": 0.48,
+      "learning_rate": 4.324428105734893e-05,
+      "loss": 0.8003,
+      "step": 1620
+    },
+    {
+      "epoch": 0.48,
+      "learning_rate": 4.3164508942464495e-05,
+      "loss": 0.7973,
+      "step": 1630
+    },
+    {
+      "epoch": 0.49,
+      "learning_rate": 4.3084343121179896e-05,
+      "loss": 0.7851,
+      "step": 1640
+    },
+    {
+      "epoch": 0.49,
+      "learning_rate": 4.300378533104814e-05,
+      "loss": 0.7982,
+      "step": 1650
+    },
+    {
+      "epoch": 0.49,
+      "learning_rate": 4.292283731811794e-05,
+      "loss": 0.797,
+      "step": 1660
+    },
+    {
+      "epoch": 0.49,
+      "learning_rate": 4.284150083689589e-05,
+      "loss": 0.7974,
+      "step": 1670
+    },
+    {
+      "epoch": 0.5,
+      "learning_rate": 4.275977765030845e-05,
+      "loss": 0.79,
+      "step": 1680
+    },
+    {
+      "epoch": 0.5,
+      "learning_rate": 4.267766952966369e-05,
+      "loss": 0.7997,
+      "step": 1690
+    },
+    {
+      "epoch": 0.5,
+      "learning_rate": 4.259517825461296e-05,
+      "loss": 0.7949,
+      "step": 1700
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 4.2512305613112266e-05,
+      "loss": 0.8015,
+      "step": 1710
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 4.2429053401383545e-05,
+      "loss": 0.7989,
+      "step": 1720
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 4.234542342387571e-05,
+      "loss": 0.7897,
+      "step": 1730
+    },
+    {
+      "epoch": 0.52,
+      "learning_rate": 4.2261417493225565e-05,
+      "loss": 0.795,
+      "step": 1740
+    },
+    {
+      "epoch": 0.52,
+      "learning_rate": 4.2177037430218504e-05,
+      "loss": 0.8037,
+      "step": 1750
+    },
+    {
+      "epoch": 0.52,
+      "learning_rate": 4.209228506374906e-05,
+      "loss": 0.7814,
+      "step": 1760
+    },
+    {
+      "epoch": 0.52,
+      "learning_rate": 4.200716223078121e-05,
+      "loss": 0.7957,
+      "step": 1770
+    },
+    {
+      "epoch": 0.53,
+      "learning_rate": 4.192167077630865e-05,
+      "loss": 0.7884,
+      "step": 1780
+    },
+    {
+      "epoch": 0.53,
+      "learning_rate": 4.183581255331475e-05,
+      "loss": 0.8069,
+      "step": 1790
+    },
+    {
+      "epoch": 0.53,
+      "learning_rate": 4.174958942273235e-05,
+      "loss": 0.7946,
+      "step": 1800
+    },
+    {
+      "epoch": 0.54,
+      "learning_rate": 4.166300325340355e-05,
+      "loss": 0.8016,
+      "step": 1810
+    },
+    {
+      "epoch": 0.54,
+      "learning_rate": 4.157605592203908e-05,
+      "loss": 0.7806,
+      "step": 1820
+    },
+    {
+      "epoch": 0.54,
+      "learning_rate": 4.148874931317767e-05,
+      "loss": 0.7786,
+      "step": 1830
+    },
+    {
+      "epoch": 0.55,
+      "learning_rate": 4.140108531914522e-05,
+      "loss": 0.7817,
+      "step": 1840
+    },
+    {
+      "epoch": 0.55,
+      "learning_rate": 4.1313065840013775e-05,
+      "loss": 0.7922,
+      "step": 1850
+    },
+    {
+      "epoch": 0.55,
+      "learning_rate": 4.1224692783560333e-05,
+      "loss": 0.7761,
+      "step": 1860
+    },
+    {
+      "epoch": 0.55,
+      "learning_rate": 4.113596806522548e-05,
+      "loss": 0.7841,
+      "step": 1870
+    },
+    {
+      "epoch": 0.56,
+      "learning_rate": 4.104689360807193e-05,
+      "loss": 0.7983,
+      "step": 1880
+    },
+    {
+      "epoch": 0.56,
+      "learning_rate": 4.095747134274276e-05,
+      "loss": 0.7753,
+      "step": 1890
+    },
+    {
+      "epoch": 0.56,
+      "learning_rate": 4.086770320741965e-05,
+      "loss": 0.7905,
+      "step": 1900
+    },
+    {
+      "epoch": 0.57,
+      "learning_rate": 4.077759114778081e-05,
+      "loss": 0.7901,
+      "step": 1910
+    },
+    {
+      "epoch": 0.57,
+      "learning_rate": 4.068713711695885e-05,
+      "loss": 0.7834,
+      "step": 1920
+    },
+    {
+      "epoch": 0.57,
+      "learning_rate": 4.059634307549841e-05,
+      "loss": 0.7752,
+      "step": 1930
+    },
+    {
+      "epoch": 0.57,
+      "learning_rate": 4.0505210991313714e-05,
+      "loss": 0.7905,
+      "step": 1940
+    },
+    {
+      "epoch": 0.58,
+      "learning_rate": 4.0413742839645855e-05,
+      "loss": 0.7824,
+      "step": 1950
+    },
+    {
+      "epoch": 0.58,
+      "learning_rate": 4.032194060302005e-05,
+      "loss": 0.793,
+      "step": 1960
+    },
+    {
+      "epoch": 0.58,
+      "learning_rate": 4.02298062712026e-05,
+      "loss": 0.7911,
+      "step": 1970
+    },
+    {
+      "epoch": 0.59,
+      "learning_rate": 4.013734184115783e-05,
+      "loss": 0.7927,
+      "step": 1980
+    },
+    {
+      "epoch": 0.59,
+      "learning_rate": 4.004454931700475e-05,
+      "loss": 0.7827,
+      "step": 1990
+    },
+    {
+      "epoch": 0.59,
+      "learning_rate": 3.995143070997367e-05,
+      "loss": 0.785,
+      "step": 2000
+    },
+    {
+      "epoch": 0.6,
+      "learning_rate": 3.985798803836256e-05,
+      "loss": 0.7922,
+      "step": 2010
+    },
+    {
+      "epoch": 0.6,
+      "learning_rate": 3.976422332749331e-05,
+      "loss": 0.7969,
+      "step": 2020
+    },
+    {
+      "epoch": 0.6,
+      "learning_rate": 3.967013860966787e-05,
+      "loss": 0.7801,
+      "step": 2030
+    },
+    {
+      "epoch": 0.6,
+      "learning_rate": 3.957573592412417e-05,
+      "loss": 0.7876,
+      "step": 2040
+    },
+    {
+      "epoch": 0.61,
+      "learning_rate": 3.948101731699192e-05,
+      "loss": 0.7862,
+      "step": 2050
+    },
+    {
+      "epoch": 0.61,
+      "learning_rate": 3.938598484124827e-05,
+      "loss": 0.7855,
+      "step": 2060
+    },
+    {
+      "epoch": 0.61,
+      "learning_rate": 3.929064055667333e-05,
+      "loss": 0.7917,
+      "step": 2070
+    },
+    {
+      "epoch": 0.62,
+      "learning_rate": 3.919498652980546e-05,
+      "loss": 0.7855,
+      "step": 2080
+    },
+    {
+      "epoch": 0.62,
+      "learning_rate": 3.909902483389658e-05,
+      "loss": 0.7641,
+      "step": 2090
+    },
+    {
+      "epoch": 0.62,
+      "learning_rate": 3.900275754886714e-05,
+      "loss": 0.784,
+      "step": 2100
+    },
+    {
+      "epoch": 0.63,
+      "learning_rate": 3.8906186761261095e-05,
+      "loss": 0.7745,
+      "step": 2110
+    },
+    {
+      "epoch": 0.63,
+      "learning_rate": 3.880931456420066e-05,
+      "loss": 0.7913,
+      "step": 2120
+    },
+    {
+      "epoch": 0.63,
+      "learning_rate": 3.8712143057340935e-05,
+      "loss": 0.7823,
+      "step": 2130
+    },
+    {
+      "epoch": 0.63,
+      "learning_rate": 3.861467434682442e-05,
+      "loss": 0.7834,
+      "step": 2140
+    },
+    {
+      "epoch": 0.64,
+      "learning_rate": 3.851691054523534e-05,
+      "loss": 0.7929,
+      "step": 2150
+    },
+    {
+      "epoch": 0.64,
+      "learning_rate": 3.841885377155388e-05,
+      "loss": 0.7751,
+      "step": 2160
+    },
+    {
+      "epoch": 0.64,
+      "learning_rate": 3.832050615111023e-05,
+      "loss": 0.7814,
+      "step": 2170
+    },
+    {
+      "epoch": 0.65,
+      "learning_rate": 3.8221869815538544e-05,
+      "loss": 0.7833,
+      "step": 2180
+    },
+    {
+      "epoch": 0.65,
+      "learning_rate": 3.812294690273074e-05,
+      "loss": 0.7829,
+      "step": 2190
+    },
+    {
+      "epoch": 0.65,
+      "learning_rate": 3.802373955679011e-05,
+      "loss": 0.773,
+      "step": 2200
+    },
+    {
+      "epoch": 0.65,
+      "learning_rate": 3.7924249927984936e-05,
+      "loss": 0.7827,
+      "step": 2210
+    },
+    {
+      "epoch": 0.66,
+      "learning_rate": 3.78244801727018e-05,
+      "loss": 0.7863,
+      "step": 2220
+    },
+    {
+      "epoch": 0.66,
+      "learning_rate": 3.77244324533989e-05,
+      "loss": 0.7881,
+      "step": 2230
+    },
+    {
+      "epoch": 0.66,
+      "learning_rate": 3.762410893855916e-05,
+      "loss": 0.7889,
+      "step": 2240
+    },
+    {
+      "epoch": 0.67,
+      "learning_rate": 3.752351180264323e-05,
+      "loss": 0.7754,
+      "step": 2250
+    },
+    {
+      "epoch": 0.67,
+      "learning_rate": 3.7422643226042344e-05,
+      "loss": 0.7815,
+      "step": 2260
+    },
+    {
+      "epoch": 0.67,
+      "learning_rate": 3.732150539503109e-05,
+      "loss": 0.7749,
+      "step": 2270
+    },
+    {
+      "epoch": 0.68,
+      "learning_rate": 3.722010050172e-05,
+      "loss": 0.7686,
+      "step": 2280
+    },
+    {
+      "epoch": 0.68,
+      "learning_rate": 3.711843074400805e-05,
+      "loss": 0.7918,
+      "step": 2290
+    },
+    {
+      "epoch": 0.68,
+      "learning_rate": 3.701649832553499e-05,
+      "loss": 0.7779,
+      "step": 2300
+    },
+    {
+      "epoch": 0.68,
+      "learning_rate": 3.691430545563365e-05,
+      "loss": 0.7677,
+      "step": 2310
+    },
+    {
+      "epoch": 0.69,
+      "learning_rate": 3.6811854349281984e-05,
+      "loss": 0.7758,
+      "step": 2320
+    },
+    {
+      "epoch": 0.69,
+      "learning_rate": 3.670914722705508e-05,
+      "loss": 0.7635,
+      "step": 2330
+    },
+    {
+      "epoch": 0.69,
+      "learning_rate": 3.660618631507706e-05,
+      "loss": 0.7778,
+      "step": 2340
+    },
+    {
+      "epoch": 0.7,
+      "learning_rate": 3.6502973844972806e-05,
+      "loss": 0.772,
+      "step": 2350
+    },
+    {
+      "epoch": 0.7,
+      "learning_rate": 3.6399512053819574e-05,
+      "loss": 0.7747,
+      "step": 2360
+    },
+    {
+      "epoch": 0.7,
+      "learning_rate": 3.6295803184098546e-05,
+      "loss": 0.7956,
+      "step": 2370
+    },
+    {
+      "epoch": 0.71,
+      "learning_rate": 3.619184948364619e-05,
+      "loss": 0.7699,
+      "step": 2380
+    },
+    {
+      "epoch": 0.71,
+      "learning_rate": 3.608765320560558e-05,
+      "loss": 0.7876,
+      "step": 2390
+    },
+    {
+      "epoch": 0.71,
+      "learning_rate": 3.59832166083775e-05,
+      "loss": 0.7778,
+      "step": 2400
+    },
+    {
+      "epoch": 0.71,
+      "learning_rate": 3.587854195557156e-05,
+      "loss": 0.7911,
+      "step": 2410
+    },
+    {
+      "epoch": 0.72,
+      "learning_rate": 3.577363151595706e-05,
+      "loss": 0.7856,
+      "step": 2420
+    },
+    {
+      "epoch": 0.72,
+      "learning_rate": 3.566848756341391e-05,
+      "loss": 0.7818,
+      "step": 2430
+    },
+    {
+      "epoch": 0.72,
+      "learning_rate": 3.556311237688327e-05,
+      "loss": 0.7754,
+      "step": 2440
+    },
+    {
+      "epoch": 0.73,
+      "learning_rate": 3.545750824031816e-05,
+      "loss": 0.7958,
+      "step": 2450
+    },
+    {
+      "epoch": 0.73,
+      "learning_rate": 3.535167744263401e-05,
+      "loss": 0.777,
+      "step": 2460
+    },
+    {
+      "epoch": 0.73,
+      "learning_rate": 3.524562227765897e-05,
+      "loss": 0.7774,
+      "step": 2470
+    },
+    {
+      "epoch": 0.73,
+      "learning_rate": 3.5139345044084284e-05,
+      "loss": 0.782,
+      "step": 2480
+    },
+    {
+      "epoch": 0.74,
+      "learning_rate": 3.503284804541438e-05,
+      "loss": 0.7888,
+      "step": 2490
+    },
+    {
+      "epoch": 0.74,
+      "learning_rate": 3.492613358991701e-05,
+      "loss": 0.7684,
+      "step": 2500
+    },
+    {
+      "epoch": 0.74,
+      "learning_rate": 3.481920399057316e-05,
+      "loss": 0.7783,
+      "step": 2510
+    },
+    {
+      "epoch": 0.75,
+      "learning_rate": 3.471206156502698e-05,
+      "loss": 0.7706,
+      "step": 2520
+    },
+    {
+      "epoch": 0.75,
+      "learning_rate": 3.460470863553549e-05,
+      "loss": 0.7739,
+      "step": 2530
+    },
+    {
+      "epoch": 0.75,
+      "learning_rate": 3.449714752891829e-05,
+      "loss": 0.7786,
+      "step": 2540
+    },
+    {
+      "epoch": 0.76,
+      "learning_rate": 3.4389380576507136e-05,
+      "loss": 0.7641,
+      "step": 2550
+    },
+    {
+      "epoch": 0.76,
+      "learning_rate": 3.428141011409534e-05,
+      "loss": 0.7723,
+      "step": 2560
+    },
+    {
+      "epoch": 0.76,
+      "learning_rate": 3.417323848188721e-05,
+      "loss": 0.7827,
+      "step": 2570
+    },
+    {
+      "epoch": 0.76,
+      "learning_rate": 3.406486802444731e-05,
+      "loss": 0.7714,
+      "step": 2580
+    },
+    {
+      "epoch": 0.77,
+      "learning_rate": 3.395630109064963e-05,
+      "loss": 0.7785,
+      "step": 2590
+    },
+    {
+      "epoch": 0.77,
+      "learning_rate": 3.38475400336267e-05,
+      "loss": 0.7715,
+      "step": 2600
+    },
+    {
+      "epoch": 0.77,
+      "learning_rate": 3.3738587210718555e-05,
+      "loss": 0.7736,
+      "step": 2610
+    },
+    {
+      "epoch": 0.78,
+      "learning_rate": 3.362944498342165e-05,
+      "loss": 0.7679,
+      "step": 2620
+    },
+    {
+      "epoch": 0.78,
+      "learning_rate": 3.352011571733772e-05,
+      "loss": 0.7754,
+      "step": 2630
+    },
+    {
+      "epoch": 0.78,
+      "learning_rate": 3.341060178212242e-05,
+      "loss": 0.786,
+      "step": 2640
+    },
+    {
+      "epoch": 0.79,
+      "learning_rate": 3.330090555143405e-05,
+      "loss": 0.7873,
+      "step": 2650
+    },
+    {
+      "epoch": 0.79,
+      "learning_rate": 3.319102940288206e-05,
+      "loss": 0.7699,
+      "step": 2660
+    },
+    {
+      "epoch": 0.79,
+      "learning_rate": 3.308097571797552e-05,
+      "loss": 0.7627,
+      "step": 2670
+    },
+    {
+      "epoch": 0.79,
+      "learning_rate": 3.297074688207152e-05,
+      "loss": 0.7803,
+      "step": 2680
+    },
+    {
+      "epoch": 0.8,
+      "learning_rate": 3.286034528432345e-05,
+      "loss": 0.78,
+      "step": 2690
+    },
+    {
+      "epoch": 0.8,
+      "learning_rate": 3.274977331762923e-05,
+      "loss": 0.7549,
+      "step": 2700
+    },
+    {
+      "epoch": 0.8,
+      "learning_rate": 3.2639033378579445e-05,
+      "loss": 0.7679,
+      "step": 2710
+    },
+    {
+      "epoch": 0.81,
+      "learning_rate": 3.252812786740537e-05,
+      "loss": 0.7708,
+      "step": 2720
+    },
+    {
+      "epoch": 0.81,
+      "learning_rate": 3.241705918792699e-05,
+      "loss": 0.7662,
+      "step": 2730
+    },
+    {
+      "epoch": 0.81,
+      "learning_rate": 3.230582974750088e-05,
+      "loss": 0.7705,
+      "step": 2740
+    },
+    {
+      "epoch": 0.81,
+      "learning_rate": 3.2194441956968036e-05,
+      "loss": 0.7762,
+      "step": 2750
+    },
+    {
+      "epoch": 0.82,
+      "learning_rate": 3.2082898230601574e-05,
+      "loss": 0.7689,
+      "step": 2760
+    },
+    {
+      "epoch": 0.82,
+      "learning_rate": 3.1971200986054476e-05,
+      "loss": 0.7834,
+      "step": 2770
+    },
+    {
+      "epoch": 0.82,
+      "learning_rate": 3.185935264430714e-05,
+      "loss": 0.7784,
+      "step": 2780
+    },
+    {
+      "epoch": 0.83,
+      "learning_rate": 3.174735562961491e-05,
+      "loss": 0.7749,
+      "step": 2790
+    },
+    {
+      "epoch": 0.83,
+      "learning_rate": 3.1635212369455535e-05,
+      "loss": 0.7776,
+      "step": 2800
+    },
+    {
+      "epoch": 0.83,
+      "learning_rate": 3.15229252944766e-05,
+      "loss": 0.7708,
+      "step": 2810
+    },
+    {
+      "epoch": 0.84,
+      "learning_rate": 3.141049683844275e-05,
+      "loss": 0.7655,
+      "step": 2820
+    },
+    {
+      "epoch": 0.84,
+      "learning_rate": 3.129792943818303e-05,
+      "loss": 0.774,
+      "step": 2830
+    },
+    {
+      "epoch": 0.84,
+      "learning_rate": 3.118522553353799e-05,
+      "loss": 0.7577,
+      "step": 2840
+    },
+    {
+      "epoch": 0.84,
+      "learning_rate": 3.107238756730689e-05,
+      "loss": 0.7657,
+      "step": 2850
+    },
+    {
+      "epoch": 0.85,
+      "learning_rate": 3.095941798519468e-05,
+      "loss": 0.7783,
+      "step": 2860
+    },
+    {
+      "epoch": 0.85,
+      "learning_rate": 3.084631923575901e-05,
+      "loss": 0.7655,
+      "step": 2870
+    },
+    {
+      "epoch": 0.85,
+      "learning_rate": 3.0733093770357194e-05,
+      "loss": 0.7708,
+      "step": 2880
+    },
+    {
+      "epoch": 0.86,
+      "learning_rate": 3.0619744043093e-05,
+      "loss": 0.7671,
+      "step": 2890
+    },
+    {
+      "epoch": 0.86,
+      "learning_rate": 3.0506272510763557e-05,
+      "loss": 0.7774,
+      "step": 2900
+    },
+    {
+      "epoch": 0.86,
+      "learning_rate": 3.0392681632806036e-05,
+      "loss": 0.77,
+      "step": 2910
+    },
+    {
+      "epoch": 0.87,
+      "learning_rate": 3.0278973871244366e-05,
+      "loss": 0.7754,
+      "step": 2920
+    },
+    {
+      "epoch": 0.87,
+      "learning_rate": 3.0165151690635855e-05,
+      "loss": 0.7837,
+      "step": 2930
+    },
+    {
+      "epoch": 0.87,
+      "learning_rate": 3.0051217558017812e-05,
+      "loss": 0.7769,
+      "step": 2940
+    },
+    {
+      "epoch": 0.87,
+      "learning_rate": 2.993717394285403e-05,
+      "loss": 0.7568,
+      "step": 2950
+    },
+    {
+      "epoch": 0.88,
+      "learning_rate": 2.982302331698128e-05,
+      "loss": 0.7774,
+      "step": 2960
+    },
+    {
+      "epoch": 0.88,
+      "learning_rate": 2.9708768154555732e-05,
+      "loss": 0.7629,
+      "step": 2970
+    },
+    {
+      "epoch": 0.88,
+      "learning_rate": 2.959441093199935e-05,
+      "loss": 0.7679,
+      "step": 2980
+    },
+    {
+      "epoch": 0.89,
+      "learning_rate": 2.9479954127946187e-05,
+      "loss": 0.772,
+      "step": 2990
+    },
+    {
+      "epoch": 0.89,
+      "learning_rate": 2.936540022318866e-05,
+      "loss": 0.7806,
+      "step": 3000
+    },
+    {
+      "epoch": 0.89,
+      "learning_rate": 2.9250751700623814e-05,
+      "loss": 0.7613,
+      "step": 3010
+    },
+    {
+      "epoch": 0.89,
+      "learning_rate": 2.9136011045199484e-05,
+      "loss": 0.7712,
+      "step": 3020
+    },
+    {
+      "epoch": 0.9,
+      "learning_rate": 2.9021180743860443e-05,
+      "loss": 0.7768,
+      "step": 3030
+    },
+    {
+      "epoch": 0.9,
+      "learning_rate": 2.8906263285494468e-05,
+      "loss": 0.7697,
+      "step": 3040
+    },
+    {
+      "epoch": 0.9,
+      "learning_rate": 2.8791261160878435e-05,
+      "loss": 0.7699,
+      "step": 3050
+    },
+    {
+      "epoch": 0.91,
+      "learning_rate": 2.8676176862624333e-05,
+      "loss": 0.7687,
+      "step": 3060
+    },
+    {
+      "epoch": 0.91,
+      "learning_rate": 2.8561012885125194e-05,
+      "loss": 0.7728,
+      "step": 3070
+    },
+    {
+      "epoch": 0.91,
+      "learning_rate": 2.8445771724501082e-05,
+      "loss": 0.7716,
+      "step": 3080
+    },
+    {
+      "epoch": 0.92,
+      "learning_rate": 2.8330455878544937e-05,
+      "loss": 0.768,
+      "step": 3090
+    },
+    {
+      "epoch": 0.92,
+      "learning_rate": 2.8215067846668493e-05,
+      "loss": 0.7657,
+      "step": 3100
+    },
+    {
+      "epoch": 0.92,
+      "learning_rate": 2.8099610129848066e-05,
+      "loss": 0.7699,
+      "step": 3110
+    },
+    {
+      "epoch": 0.92,
+      "learning_rate": 2.7984085230570355e-05,
+      "loss": 0.7643,
+      "step": 3120
+    },
+    {
+      "epoch": 0.93,
+      "learning_rate": 2.7868495652778208e-05,
+      "loss": 0.7532,
+      "step": 3130
+    },
+    {
+      "epoch": 0.93,
+      "learning_rate": 2.775284390181634e-05,
+      "loss": 0.7562,
+      "step": 3140
+    },
+    {
+      "epoch": 0.93,
+      "learning_rate": 2.763713248437705e-05,
+      "loss": 0.7578,
+      "step": 3150
+    },
+    {
+      "epoch": 0.94,
+      "learning_rate": 2.7521363908445864e-05,
+      "loss": 0.7698,
+      "step": 3160
+    },
+    {
+      "epoch": 0.94,
+      "learning_rate": 2.7405540683247194e-05,
+      "loss": 0.7655,
+      "step": 3170
+    },
+    {
+      "epoch": 0.94,
+      "learning_rate": 2.728966531918995e-05,
+      "loss": 0.7736,
+      "step": 3180
+    },
+    {
+      "epoch": 0.95,
+      "learning_rate": 2.7173740327813118e-05,
+      "loss": 0.7739,
+      "step": 3190
+    },
+    {
+      "epoch": 0.95,
+      "learning_rate": 2.7057768221731345e-05,
+      "loss": 0.76,
+      "step": 3200
+    },
+    {
+      "epoch": 0.95,
+      "learning_rate": 2.694175151458045e-05,
+      "loss": 0.7769,
+      "step": 3210
+    },
+    {
+      "epoch": 0.95,
+      "learning_rate": 2.6825692720962946e-05,
+      "loss": 0.7594,
+      "step": 3220
+    },
+    {
+      "epoch": 0.96,
+      "learning_rate": 2.670959435639359e-05,
+      "loss": 0.753,
+      "step": 3230
+    },
+    {
+      "epoch": 0.96,
+      "learning_rate": 2.6593458937244786e-05,
+      "loss": 0.7587,
+      "step": 3240
+    },
+    {
+      "epoch": 0.96,
+      "learning_rate": 2.6477288980692082e-05,
+      "loss": 0.7565,
+      "step": 3250
+    },
+    {
+      "epoch": 0.97,
+      "learning_rate": 2.636108700465961e-05,
+      "loss": 0.7599,
+      "step": 3260
+    },
+    {
+      "epoch": 0.97,
+      "learning_rate": 2.624485552776551e-05,
+      "loss": 0.7628,
+      "step": 3270
+    },
+    {
+      "epoch": 0.97,
+      "learning_rate": 2.612859706926733e-05,
+      "loss": 0.7702,
+      "step": 3280
+    },
+    {
+      "epoch": 0.97,
+      "learning_rate": 2.6012314149007434e-05,
+      "loss": 0.763,
+      "step": 3290
+    },
+    {
+      "epoch": 0.98,
+      "learning_rate": 2.5896009287358393e-05,
+      "loss": 0.7709,
+      "step": 3300
+    },
+    {
+      "epoch": 0.98,
+      "learning_rate": 2.5779685005168326e-05,
+      "loss": 0.7643,
+      "step": 3310
+    },
+    {
+      "epoch": 0.98,
+      "learning_rate": 2.5663343823706303e-05,
+      "loss": 0.7537,
+      "step": 3320
+    },
+    {
+      "epoch": 0.99,
+      "learning_rate": 2.5546988264607656e-05,
+      "loss": 0.7665,
+      "step": 3330
+    },
+    {
+      "epoch": 0.99,
+      "learning_rate": 2.5430620849819375e-05,
+      "loss": 0.7771,
+      "step": 3340
+    },
+    {
+      "epoch": 0.99,
+      "learning_rate": 2.5314244101545382e-05,
+      "loss": 0.7519,
+      "step": 3350
+    },
+    {
+      "epoch": 1.0,
+      "learning_rate": 2.5197860542191914e-05,
+      "loss": 0.7581,
+      "step": 3360
+    },
+    {
+      "epoch": 1.0,
+      "learning_rate": 2.5081472694312836e-05,
+      "loss": 0.755,
+      "step": 3370
+    },
+    {
+      "epoch": 1.0,
+      "learning_rate": 2.4965083080554964e-05,
+      "loss": 0.7534,
+      "step": 3380
+    },
+    {
+      "epoch": 1.0,
+      "learning_rate": 2.484869422360338e-05,
+      "loss": 0.752,
+      "step": 3390
+    },
+    {
+      "epoch": 1.01,
+      "learning_rate": 2.4732308646126777e-05,
+      "loss": 0.7502,
+      "step": 3400
+    },
+    {
+      "epoch": 1.01,
+      "learning_rate": 2.461592887072275e-05,
+      "loss": 0.7783,
+      "step": 3410
+    },
+    {
+      "epoch": 1.01,
+      "learning_rate": 2.4499557419863157e-05,
+      "loss": 0.7661,
+      "step": 3420
+    },
+    {
+      "epoch": 1.02,
+      "learning_rate": 2.4383196815839407e-05,
+      "loss": 0.7487,
+      "step": 3430
+    },
+    {
+      "epoch": 1.02,
+      "learning_rate": 2.4266849580707818e-05,
+      "loss": 0.7581,
+      "step": 3440
+    },
+    {
+      "epoch": 1.02,
+      "learning_rate": 2.415051823623495e-05,
+      "loss": 0.7625,
+      "step": 3450
+    },
+    {
+      "epoch": 1.03,
+      "learning_rate": 2.4034205303842924e-05,
+      "loss": 0.7671,
+      "step": 3460
+    },
+    {
+      "epoch": 1.03,
+      "learning_rate": 2.391791330455481e-05,
+      "loss": 0.7531,
+      "step": 3470
+    },
+    {
+      "epoch": 1.03,
+      "learning_rate": 2.3801644758939945e-05,
+      "loss": 0.7576,
+      "step": 3480
+    },
+    {
+      "epoch": 1.03,
+      "learning_rate": 2.368540218705932e-05,
+      "loss": 0.7571,
+      "step": 3490
+    },
+    {
+      "epoch": 1.04,
+      "learning_rate": 2.356918810841099e-05,
+      "loss": 0.7586,
+      "step": 3500
+    },
+    {
+      "epoch": 1.04,
+      "learning_rate": 2.3453005041875396e-05,
+      "loss": 0.7614,
+      "step": 3510
+    },
+    {
+      "epoch": 1.04,
+      "learning_rate": 2.333685550566082e-05,
+      "loss": 0.7538,
+      "step": 3520
+    },
+    {
+      "epoch": 1.05,
+      "learning_rate": 2.3220742017248797e-05,
+      "loss": 0.7614,
+      "step": 3530
+    },
+    {
+      "epoch": 1.05,
+      "learning_rate": 2.310466709333954e-05,
+      "loss": 0.7603,
+      "step": 3540
+    },
+    {
+      "epoch": 1.05,
+      "learning_rate": 2.2988633249797398e-05,
+      "loss": 0.7656,
+      "step": 3550
+    },
+    {
+      "epoch": 1.05,
+      "learning_rate": 2.2872643001596318e-05,
+      "loss": 0.7444,
+      "step": 3560
+    },
+    {
+      "epoch": 1.06,
+      "learning_rate": 2.275669886276535e-05,
+      "loss": 0.7527,
+      "step": 3570
+    },
+    {
+      "epoch": 1.06,
+      "learning_rate": 2.264080334633414e-05,
+      "loss": 0.7414,
+      "step": 3580
+    },
+    {
+      "epoch": 1.06,
+      "learning_rate": 2.252495896427847e-05,
+      "loss": 0.7533,
+      "step": 3590
+    },
+    {
+      "epoch": 1.07,
+      "learning_rate": 2.240916822746581e-05,
+      "loss": 0.7577,
+      "step": 3600
+    },
+    {
+      "epoch": 1.07,
+      "learning_rate": 2.22934336456009e-05,
+      "loss": 0.7524,
+      "step": 3610
+    },
+    {
+      "epoch": 1.07,
+      "learning_rate": 2.217775772717135e-05,
+      "loss": 0.744,
+      "step": 3620
+    },
+    {
+      "epoch": 1.08,
+      "learning_rate": 2.2062142979393265e-05,
+      "loss": 0.7679,
+      "step": 3630
+    },
+    {
+      "epoch": 1.08,
+      "learning_rate": 2.1946591908156918e-05,
+      "loss": 0.7633,
+      "step": 3640
+    },
+    {
+      "epoch": 1.08,
+      "learning_rate": 2.1831107017972414e-05,
+      "loss": 0.7735,
+      "step": 3650
+    },
+    {
+      "epoch": 1.08,
+      "learning_rate": 2.1715690811915424e-05,
+      "loss": 0.7577,
+      "step": 3660
+    },
+    {
+      "epoch": 1.09,
+      "learning_rate": 2.1600345791572923e-05,
+      "loss": 0.765,
+      "step": 3670
+    },
+    {
+      "epoch": 1.09,
+      "learning_rate": 2.148507445698898e-05,
+      "loss": 0.7444,
+      "step": 3680
+    },
+    {
+      "epoch": 1.09,
+      "learning_rate": 2.1369879306610548e-05,
+      "loss": 0.7527,
+      "step": 3690
+    },
+    {
+      "epoch": 1.1,
+      "learning_rate": 2.125476283723333e-05,
+      "loss": 0.7679,
+      "step": 3700
+    },
+    {
+      "epoch": 1.1,
+      "learning_rate": 2.1139727543947687e-05,
+      "loss": 0.765,
+      "step": 3710
+    },
+    {
+      "epoch": 1.1,
+      "learning_rate": 2.1024775920084488e-05,
+      "loss": 0.7662,
+      "step": 3720
+    },
+    {
+      "epoch": 1.11,
+      "learning_rate": 2.0909910457161136e-05,
+      "loss": 0.7583,
+      "step": 3730
+    },
+    {
+      "epoch": 1.11,
+      "learning_rate": 2.079513364482753e-05,
+      "loss": 0.7584,
+      "step": 3740
+    },
+    {
+      "epoch": 1.11,
+      "learning_rate": 2.0680447970812123e-05,
+      "loss": 0.7606,
+      "step": 3750
+    },
+    {
+      "epoch": 1.11,
+      "learning_rate": 2.056585592086798e-05,
+      "loss": 0.7488,
+      "step": 3760
+    },
+    {
+      "epoch": 1.12,
+      "learning_rate": 2.0451359978718913e-05,
+      "loss": 0.7525,
+      "step": 3770
+    },
+    {
+      "epoch": 1.12,
+      "learning_rate": 2.0336962626005654e-05,
+      "loss": 0.7628,
+      "step": 3780
+    },
+    {
+      "epoch": 1.12,
+      "learning_rate": 2.022266634223206e-05,
+      "loss": 0.7413,
+      "step": 3790
+    },
+    {
+      "epoch": 1.13,
+      "learning_rate": 2.0108473604711368e-05,
+      "loss": 0.761,
+      "step": 3800
+    },
+    {
+      "epoch": 1.13,
+      "learning_rate": 1.99943868885125e-05,
+      "loss": 0.7474,
+      "step": 3810
+    },
+    {
+      "epoch": 1.13,
+      "learning_rate": 1.988040866640642e-05,
+      "loss": 0.7581,
+      "step": 3820
+    },
+    {
+      "epoch": 1.13,
+      "learning_rate": 1.9766541408812537e-05,
+      "loss": 0.7464,
+      "step": 3830
+    },
+    {
+      "epoch": 1.14,
+      "learning_rate": 1.965278758374518e-05,
+      "loss": 0.7629,
+      "step": 3840
+    },
+    {
+      "epoch": 1.14,
+      "learning_rate": 1.953914965676006e-05,
+      "loss": 0.7509,
+      "step": 3850
+    },
+    {
+      "epoch": 1.14,
+      "learning_rate": 1.9425630090900877e-05,
+      "loss": 0.7564,
+      "step": 3860
+    },
+    {
+      "epoch": 1.15,
+      "learning_rate": 1.9312231346645892e-05,
+      "loss": 0.7601,
+      "step": 3870
+    },
+    {
+      "epoch": 1.15,
+      "learning_rate": 1.9198955881854645e-05,
+      "loss": 0.7694,
+      "step": 3880
+    },
+    {
+      "epoch": 1.15,
+      "learning_rate": 1.9085806151714645e-05,
+      "loss": 0.7593,
+      "step": 3890
+    },
+    {
+      "epoch": 1.16,
+      "learning_rate": 1.8972784608688164e-05,
+      "loss": 0.7503,
+      "step": 3900
+    },
+    {
+      "epoch": 1.16,
+      "learning_rate": 1.8859893702459076e-05,
+      "loss": 0.748,
+      "step": 3910
+    },
+    {
+      "epoch": 1.16,
+      "learning_rate": 1.8747135879879802e-05,
+      "loss": 0.7675,
+      "step": 3920
+    },
+    {
+      "epoch": 1.16,
+      "learning_rate": 1.8634513584918217e-05,
+      "loss": 0.7553,
+      "step": 3930
+    },
+    {
+      "epoch": 1.17,
+      "learning_rate": 1.85220292586047e-05,
+      "loss": 0.7511,
+      "step": 3940
+    },
+    {
+      "epoch": 1.17,
+      "learning_rate": 1.8409685338979255e-05,
+      "loss": 0.7533,
+      "step": 3950
+    },
+    {
+      "epoch": 1.17,
+      "learning_rate": 1.8297484261038612e-05,
+      "loss": 0.7553,
+      "step": 3960
+    },
+    {
+      "epoch": 1.18,
+      "learning_rate": 1.8185428456683513e-05,
+      "loss": 0.7563,
+      "step": 3970
+    },
+    {
+      "epoch": 1.18,
+      "learning_rate": 1.807352035466594e-05,
+      "loss": 0.7512,
+      "step": 3980
+    },
+    {
+      "epoch": 1.18,
+      "learning_rate": 1.7961762380536522e-05,
+      "loss": 0.7502,
+      "step": 3990
+    },
+    {
+      "epoch": 1.19,
+      "learning_rate": 1.7850156956591943e-05,
+      "loss": 0.7614,
+      "step": 4000
+    }
+  ],
+  "max_steps": 6748,
+  "num_train_epochs": 2,
+  "total_flos": 7.117499263600296e+18,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-4000/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5f710e8a04dbb33457b5b725adb1da191a7b05d7ab01f6ec60c73386df9d8286
+size 3277

checkpoint-5000/README.md ADDED Viewed

	@@ -0,0 +1,20 @@

+---
+library_name: peft
+---
+## Training procedure
+The following `bitsandbytes` quantization config was used during training:
+- load_in_8bit: False
+- load_in_4bit: True
+- llm_int8_threshold: 6.0
+- llm_int8_skip_modules: None
+- llm_int8_enable_fp32_cpu_offload: False
+- llm_int8_has_fp16_weight: False
+- bnb_4bit_quant_type: nf4
+- bnb_4bit_use_double_quant: True
+- bnb_4bit_compute_dtype: float16
+### Framework versions
+- PEFT 0.4.0

checkpoint-5000/adapter_config.json ADDED Viewed

	@@ -0,0 +1,21 @@

+{
+  "auto_mapping": null,
+  "base_model_name_or_path": "./Llama-2-7b-chat-hf",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 32.0,
+  "lora_dropout": 0.1,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 8,
+  "revision": null,
+  "target_modules": [
+    "q_proj",
+    "v_proj"
+  ],
+  "task_type": "CAUSAL_LM"
+}