Upload folder using huggingface_hub

Browse files

Files changed (10) hide show

README.md +21 -0
adapter_config.json +21 -0
adapter_model.bin +3 -0
special_tokens_map.json +24 -0
tokenizer.json +0 -0
tokenizer.model +3 -0
tokenizer_config.json +32 -0
train_args.json +123 -0
training_args.bin +3 -0
training_logs.json +1067 -0

README.md ADDED Viewed

	@@ -0,0 +1,21 @@

+---
+library_name: peft
+---
+## Training procedure
+The following `bitsandbytes` quantization config was used during training:
+- quant_method: bitsandbytes
+- load_in_8bit: False
+- load_in_4bit: True
+- llm_int8_threshold: 6.0
+- llm_int8_skip_modules: None
+- llm_int8_enable_fp32_cpu_offload: False
+- llm_int8_has_fp16_weight: False
+- bnb_4bit_quant_type: nf4
+- bnb_4bit_use_double_quant: True
+- bnb_4bit_compute_dtype: float16
+### Framework versions
+- PEFT 0.5.0

adapter_config.json ADDED Viewed

	@@ -0,0 +1,21 @@

+{
+  "auto_mapping": null,
+  "base_model_name_or_path": "models/llama-30b",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 16,
+  "lora_dropout": 0.0,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 64,
+  "revision": null,
+  "target_modules": [
+    "q_proj",
+    "v_proj"
+  ],
+  "task_type": "SEQ_CLS"
+}

adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7f71d6c6951c6c274f59f10f4eee211154b309bedb38e021f4bedeb11601df07
+size 409081617

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,24 @@

+{
+  "bos_token": {
+    "content": "<s>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": "</s>",
+  "unk_token": {
+    "content": "<unk>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  }
+}

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer.model ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9e556afd44213b6bd1be2b850ebbbd98f5481437a8021afaf58ee7fb1818d347
+size 499723

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,32 @@

+{
+  "bos_token": {
+    "__type": "AddedToken",
+    "content": "<s>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "clean_up_tokenization_spaces": false,
+  "eos_token": {
+    "__type": "AddedToken",
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "model_max_length": 2048,
+  "pad_token": null,
+  "sp_model_kwargs": {},
+  "tokenizer_class": "LlamaTokenizer",
+  "unk_token": {
+    "__type": "AddedToken",
+    "content": "<unk>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "use_default_system_prompt": true
+}

train_args.json ADDED Viewed

	@@ -0,0 +1,123 @@

+{
+    "initial_model_dir": "models/llama-30b",
+    "distribution_id": "math_hard",
+    "date_trained": "11/10/2023 08:18:27",
+    "output_dir": "models/classify_lora/llama-30b-math_hard",
+    "overwrite_output_dir": false,
+    "do_train": false,
+    "do_eval": true,
+    "do_predict": false,
+    "evaluation_strategy": "steps",
+    "prediction_loss_only": false,
+    "per_device_train_batch_size": 8,
+    "per_device_eval_batch_size": 8,
+    "per_gpu_train_batch_size": null,
+    "per_gpu_eval_batch_size": null,
+    "gradient_accumulation_steps": 1,
+    "eval_accumulation_steps": null,
+    "eval_delay": 0,
+    "learning_rate": 0.0002,
+    "weight_decay": 0.0,
+    "adam_beta1": 0.9,
+    "adam_beta2": 0.999,
+    "adam_epsilon": 1e-08,
+    "max_grad_norm": 0.3,
+    "num_train_epochs": 2,
+    "max_steps": 100,
+    "lr_scheduler_type": "constant",
+    "warmup_ratio": 0.03,
+    "warmup_steps": 0,
+    "log_level": "passive",
+    "log_level_replica": "warning",
+    "log_on_each_node": true,
+    "logging_dir": "models/classify_lora/llama-30b-math_hard/runs/Oct11_05-49-08_compute-permanent-node-975",
+    "logging_strategy": "steps",
+    "logging_first_step": false,
+    "logging_steps": 1,
+    "logging_nan_inf_filter": true,
+    "save_strategy": "steps",
+    "save_steps": 25,
+    "save_total_limit": 0,
+    "save_safetensors": false,
+    "save_on_each_node": false,
+    "no_cuda": false,
+    "use_cpu": false,
+    "use_mps_device": false,
+    "seed": 42,
+    "data_seed": null,
+    "jit_mode_eval": false,
+    "use_ipex": false,
+    "bf16": false,
+    "fp16": false,
+    "fp16_opt_level": "O1",
+    "half_precision_backend": "auto",
+    "bf16_full_eval": false,
+    "fp16_full_eval": false,
+    "tf32": null,
+    "local_rank": 0,
+    "ddp_backend": null,
+    "tpu_num_cores": null,
+    "tpu_metrics_debug": false,
+    "debug": [],
+    "dataloader_drop_last": false,
+    "eval_steps": 25,
+    "dataloader_num_workers": 0,
+    "past_index": -1,
+    "run_name": "train|models-classify_lora-llama-30b-math_hard",
+    "disable_tqdm": false,
+    "remove_unused_columns": false,
+    "label_names": null,
+    "load_best_model_at_end": false,
+    "metric_for_best_model": "eval_math_hard_score",
+    "greater_is_better": true,
+    "ignore_data_skip": false,
+    "sharded_ddp": [],
+    "fsdp": [],
+    "fsdp_min_num_params": 0,
+    "fsdp_config": {
+        "min_num_params": 0,
+        "xla": false,
+        "xla_fsdp_grad_ckpt": false
+    },
+    "fsdp_transformer_layer_cls_to_wrap": null,
+    "deepspeed": "configs/ds_zero_1.json",
+    "label_smoothing_factor": 0.0,
+    "optim": "paged_adamw_32bit",
+    "optim_args": null,
+    "adafactor": false,
+    "group_by_length": false,
+    "length_column_name": "length",
+    "report_to": [
+        "wandb"
+    ],
+    "ddp_find_unused_parameters": false,
+    "ddp_bucket_cap_mb": null,
+    "ddp_broadcast_buffers": null,
+    "dataloader_pin_memory": true,
+    "skip_memory_metrics": true,
+    "use_legacy_prediction_loop": false,
+    "push_to_hub": false,
+    "resume_from_checkpoint": null,
+    "hub_model_id": null,
+    "hub_strategy": "every_save",
+    "hub_token": null,
+    "hub_private_repo": false,
+    "hub_always_push": false,
+    "gradient_checkpointing": false,
+    "include_inputs_for_metrics": false,
+    "fp16_backend": "auto",
+    "push_to_hub_model_id": null,
+    "push_to_hub_organization": null,
+    "push_to_hub_token": null,
+    "_n_gpu": 1,
+    "mp_parameters": "",
+    "auto_find_batch_size": false,
+    "full_determinism": false,
+    "torchdynamo": null,
+    "ray_scope": "last",
+    "ddp_timeout": 1800,
+    "torch_compile": false,
+    "torch_compile_backend": null,
+    "torch_compile_mode": null,
+    "dispatch_batches": null
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:93a764fdaf689372fc9812c299850e445c3bc42ecfab1096e9ca2c21e2fbcbd3
+size 5115

training_logs.json ADDED Viewed

	@@ -0,0 +1,1067 @@

+[
+    {
+        "loss": 0.7313,
+        "learning_rate": 0.0002,
+        "epoch": 0.02,
+        "step": 1
+    },
+    {
+        "loss": 0.6794,
+        "learning_rate": 0.0002,
+        "epoch": 0.04,
+        "step": 2
+    },
+    {
+        "loss": 0.6862,
+        "learning_rate": 0.0002,
+        "epoch": 0.05,
+        "step": 3
+    },
+    {
+        "loss": 0.6799,
+        "learning_rate": 0.0002,
+        "epoch": 0.07,
+        "step": 4
+    },
+    {
+        "loss": 0.6825,
+        "learning_rate": 0.0002,
+        "epoch": 0.09,
+        "step": 5
+    },
+    {
+        "loss": 0.6914,
+        "learning_rate": 0.0002,
+        "epoch": 0.11,
+        "step": 6
+    },
+    {
+        "loss": 0.6325,
+        "learning_rate": 0.0002,
+        "epoch": 0.12,
+        "step": 7
+    },
+    {
+        "loss": 0.6633,
+        "learning_rate": 0.0002,
+        "epoch": 0.14,
+        "step": 8
+    },
+    {
+        "loss": 0.6252,
+        "learning_rate": 0.0002,
+        "epoch": 0.16,
+        "step": 9
+    },
+    {
+        "loss": 0.5798,
+        "learning_rate": 0.0002,
+        "epoch": 0.18,
+        "step": 10
+    },
+    {
+        "loss": 0.5536,
+        "learning_rate": 0.0002,
+        "epoch": 0.19,
+        "step": 11
+    },
+    {
+        "loss": 0.5727,
+        "learning_rate": 0.0002,
+        "epoch": 0.21,
+        "step": 12
+    },
+    {
+        "loss": 0.4765,
+        "learning_rate": 0.0002,
+        "epoch": 0.23,
+        "step": 13
+    },
+    {
+        "loss": 0.3769,
+        "learning_rate": 0.0002,
+        "epoch": 0.25,
+        "step": 14
+    },
+    {
+        "loss": 0.2708,
+        "learning_rate": 0.0002,
+        "epoch": 0.26,
+        "step": 15
+    },
+    {
+        "loss": 0.2132,
+        "learning_rate": 0.0002,
+        "epoch": 0.28,
+        "step": 16
+    },
+    {
+        "loss": 0.2204,
+        "learning_rate": 0.0002,
+        "epoch": 0.3,
+        "step": 17
+    },
+    {
+        "loss": 0.3512,
+        "learning_rate": 0.0002,
+        "epoch": 0.32,
+        "step": 18
+    },
+    {
+        "loss": 0.1736,
+        "learning_rate": 0.0002,
+        "epoch": 0.33,
+        "step": 19
+    },
+    {
+        "loss": 0.3119,
+        "learning_rate": 0.0002,
+        "epoch": 0.35,
+        "step": 20
+    },
+    {
+        "loss": 0.1878,
+        "learning_rate": 0.0002,
+        "epoch": 0.37,
+        "step": 21
+    },
+    {
+        "loss": 0.2817,
+        "learning_rate": 0.0002,
+        "epoch": 0.39,
+        "step": 22
+    },
+    {
+        "loss": 0.4016,
+        "learning_rate": 0.0002,
+        "epoch": 0.4,
+        "step": 23
+    },
+    {
+        "loss": 0.156,
+        "learning_rate": 0.0002,
+        "epoch": 0.42,
+        "step": 24
+    },
+    {
+        "loss": 0.1408,
+        "learning_rate": 0.0002,
+        "epoch": 0.44,
+        "step": 25
+    },
+    {
+        "eval_math_hard_loss": 0.2689576745033264,
+        "eval_math_hard_score": -0.07232501357793808,
+        "eval_math_hard_brier_score": 0.07232501357793808,
+        "eval_math_hard_average_probability": 0.8480575084686279,
+        "eval_math_hard_accuracy": 0.91,
+        "eval_math_hard_probabilities": [
+            0.12067427486181259,
+            0.1707480251789093,
+            0.22421833872795105,
+            0.9965168237686157,
+            0.9968488812446594,
+            0.8897665739059448,
+            0.8757681846618652,
+            0.9160223007202148,
+            0.4495812952518463,
+            0.9733548760414124,
+            0.8542622327804565,
+            0.8829213976860046,
+            0.7457072734832764,
+            0.7373321056365967,
+            0.7001582980155945,
+            0.9495631456375122,
+            0.9757802486419678,
+            0.9814878702163696,
+            0.8223016262054443,
+            0.8257706761360168,
+            0.7114197611808777,
+            0.9997543692588806,
+            0.9997970461845398,
+            0.9997699856758118,
+            0.9983037710189819,
+            0.9911226034164429,
+            0.9890031218528748,
+            0.9952235817909241,
+            0.9955497980117798,
+            0.9985560774803162,
+            0.9976275563240051,
+            0.9978576302528381,
+            0.9976431727409363,
+            0.9857828617095947,
+            0.9856427311897278,
+            0.9890527129173279,
+            0.9993459582328796,
+            0.99762362241745,
+            0.9985696077346802,
+            0.9795147180557251,
+            0.9767017364501953,
+            0.9040936827659607,
+            0.989809513092041,
+            0.9877877831459045,
+            0.9814877510070801,
+            0.9997876286506653,
+            0.9965195655822754,
+            0.9839633107185364,
+            0.44732266664505005,
+            0.5352095365524292,
+            0.5794621109962463,
+            0.9967998266220093,
+            0.9975603818893433,
+            0.9964653253555298,
+            0.9998288154602051,
+            0.9998891353607178,
+            0.9999051094055176,
+            0.2663218379020691,
+            0.4094083905220032,
+            0.7260100245475769,
+            0.9965078234672546,
+            0.9969045519828796,
+            0.998040497303009,
+            0.9707159399986267,
+            0.9864614605903625,
+            0.9651244878768921,
+            0.9996368885040283,
+            0.9995032548904419,
+            0.9982764720916748,
+            0.6076152920722961,
+            0.585483729839325,
+            0.5877071619033813,
+            0.9988491535186768,
+            0.9986512064933777,
+            0.9980589747428894,
+            0.9256494045257568,
+            0.9805311560630798,
+            0.9392337799072266,
+            0.7655142545700073,
+            0.6185799241065979,
+            0.541168212890625,
+            0.782398521900177,
+            0.8448206782341003,
+            0.7403358817100525,
+            0.8463240265846252,
+            0.8631186485290527,
+            0.8114821314811707,
+            0.9599024057388306,
+            0.7725688815116882,
+            0.3576231896877289,
+            0.027788693085312843,
+            0.8065083622932434,
+            0.8443471789360046,
+            0.8439624905586243,
+            0.727486789226532,
+            0.8130761384963989,
+            0.9100518822669983,
+            0.9845901727676392,
+            0.9753082990646362,
+            0.9655715823173523
+        ],
+        "eval_math_hard_runtime": 86.0301,
+        "eval_math_hard_samples_per_second": 1.162,
+        "eval_math_hard_steps_per_second": 0.046,
+        "epoch": 0.44,
+        "step": 25
+    },
+    {
+        "loss": 0.1166,
+        "learning_rate": 0.0002,
+        "epoch": 0.46,
+        "step": 26
+    },
+    {
+        "loss": 0.1934,
+        "learning_rate": 0.0002,
+        "epoch": 0.47,
+        "step": 27
+    },
+    {
+        "loss": 0.1695,
+        "learning_rate": 0.0002,
+        "epoch": 0.49,
+        "step": 28
+    },
+    {
+        "loss": 0.1415,
+        "learning_rate": 0.0002,
+        "epoch": 0.51,
+        "step": 29
+    },
+    {
+        "loss": 0.2946,
+        "learning_rate": 0.0002,
+        "epoch": 0.53,
+        "step": 30
+    },
+    {
+        "loss": 0.1945,
+        "learning_rate": 0.0002,
+        "epoch": 0.54,
+        "step": 31
+    },
+    {
+        "loss": 0.1672,
+        "learning_rate": 0.0002,
+        "epoch": 0.56,
+        "step": 32
+    },
+    {
+        "loss": 0.1961,
+        "learning_rate": 0.0002,
+        "epoch": 0.58,
+        "step": 33
+    },
+    {
+        "loss": 0.3305,
+        "learning_rate": 0.0002,
+        "epoch": 0.6,
+        "step": 34
+    },
+    {
+        "loss": 0.0823,
+        "learning_rate": 0.0002,
+        "epoch": 0.61,
+        "step": 35
+    },
+    {
+        "loss": 0.1063,
+        "learning_rate": 0.0002,
+        "epoch": 0.63,
+        "step": 36
+    },
+    {
+        "loss": 0.1566,
+        "learning_rate": 0.0002,
+        "epoch": 0.65,
+        "step": 37
+    },
+    {
+        "loss": 0.1957,
+        "learning_rate": 0.0002,
+        "epoch": 0.67,
+        "step": 38
+    },
+    {
+        "loss": 0.0823,
+        "learning_rate": 0.0002,
+        "epoch": 0.68,
+        "step": 39
+    },
+    {
+        "loss": 0.0602,
+        "learning_rate": 0.0002,
+        "epoch": 0.7,
+        "step": 40
+    },
+    {
+        "loss": 0.1042,
+        "learning_rate": 0.0002,
+        "epoch": 0.72,
+        "step": 41
+    },
+    {
+        "loss": 0.0696,
+        "learning_rate": 0.0002,
+        "epoch": 0.74,
+        "step": 42
+    },
+    {
+        "loss": 0.0618,
+        "learning_rate": 0.0002,
+        "epoch": 0.75,
+        "step": 43
+    },
+    {
+        "loss": 0.1516,
+        "learning_rate": 0.0002,
+        "epoch": 0.77,
+        "step": 44
+    },
+    {
+        "loss": 0.1877,
+        "learning_rate": 0.0002,
+        "epoch": 0.79,
+        "step": 45
+    },
+    {
+        "loss": 0.2814,
+        "learning_rate": 0.0002,
+        "epoch": 0.81,
+        "step": 46
+    },
+    {
+        "loss": 0.3869,
+        "learning_rate": 0.0002,
+        "epoch": 0.82,
+        "step": 47
+    },
+    {
+        "loss": 0.0865,
+        "learning_rate": 0.0002,
+        "epoch": 0.84,
+        "step": 48
+    },
+    {
+        "loss": 0.5889,
+        "learning_rate": 0.0002,
+        "epoch": 0.86,
+        "step": 49
+    },
+    {
+        "loss": 0.108,
+        "learning_rate": 0.0002,
+        "epoch": 0.88,
+        "step": 50
+    },
+    {
+        "eval_math_hard_loss": 0.4195532202720642,
+        "eval_math_hard_score": -0.08378518372774124,
+        "eval_math_hard_brier_score": 0.08378518372774124,
+        "eval_math_hard_average_probability": 0.8607721924781799,
+        "eval_math_hard_accuracy": 0.89,
+        "eval_math_hard_probabilities": [
+            0.001347638200968504,
+            0.0014310380211099982,
+            0.0292666032910347,
+            0.9999281167984009,
+            0.9999291896820068,
+            0.9515820741653442,
+            0.9991993308067322,
+            0.9985817670822144,
+            0.4427696764469147,
+            0.9999922513961792,
+            0.5870345830917358,
+            0.9338187575340271,
+            0.9995662569999695,
+            0.999679446220398,
+            0.9990984201431274,
+            0.8128757476806641,
+            0.8317935466766357,
+            0.8578028082847595,
+            0.767571747303009,
+            0.7276169061660767,
+            0.16569289565086365,
+            0.9999608993530273,
+            0.9999557733535767,
+            0.9999984502792358,
+            0.9999668598175049,
+            0.9999934434890747,
+            0.9996861219406128,
+            0.999996542930603,
+            0.9999967813491821,
+            0.9999997615814209,
+            0.999997615814209,
+            0.9999953508377075,
+            0.9999957084655762,
+            0.9973000884056091,
+            0.9996415376663208,
+            0.9997121691703796,
+            0.9999990463256836,
+            0.9999995231628418,
+            0.9999998807907104,
+            0.9920561909675598,
+            0.9743956327438354,
+            0.518930196762085,
+            0.9998225569725037,
+            0.9935445785522461,
+            0.9992994070053101,
+            0.9982439279556274,
+            0.9694525599479675,
+            0.8038814067840576,
+            0.5726821422576904,
+            0.4458751678466797,
+            0.741835355758667,
+            0.9999998807907104,
+            1.0,
+            0.9999977350234985,
+            0.9999512434005737,
+            1.0,
+            1.0,
+            0.1753261685371399,
+            0.2425578236579895,
+            0.8445780873298645,
+            0.9961126446723938,
+            0.9984958171844482,
+            0.9912378191947937,
+            0.9592325687408447,
+            0.9976963400840759,
+            0.866991400718689,
+            0.9999998807907104,
+            0.9999804496765137,
+            0.9998711347579956,
+            0.26644328236579895,
+            0.829546332359314,
+            0.8019995093345642,
+            0.9999985694885254,
+            0.9999955892562866,
+            0.9999771118164062,
+            0.9985451698303223,
+            0.9999727010726929,
+            0.9993960857391357,
+            0.9808396100997925,
+            0.8794113993644714,
+            0.8073936700820923,
+            0.963763952255249,
+            0.9844830632209778,
+            0.958784818649292,
+            0.939505934715271,
+            0.9660537838935852,
+            0.817690372467041,
+            0.9990904331207275,
+            0.7585221529006958,
+            0.4643564522266388,
+            0.11916442960500717,
+            0.9887877106666565,
+            0.9978222846984863,
+            0.8583523631095886,
+            0.8125313520431519,
+            0.8561255931854248,
+            0.8449611067771912,
+            0.9997431635856628,
+            0.9992627501487732,
+            0.9998737573623657
+        ],
+        "eval_math_hard_runtime": 86.0735,
+        "eval_math_hard_samples_per_second": 1.162,
+        "eval_math_hard_steps_per_second": 0.046,
+        "epoch": 0.88,
+        "step": 50
+    },
+    {
+        "loss": 0.0879,
+        "learning_rate": 0.0002,
+        "epoch": 0.89,
+        "step": 51
+    },
+    {
+        "loss": 0.2006,
+        "learning_rate": 0.0002,
+        "epoch": 0.91,
+        "step": 52
+    },
+    {
+        "loss": 0.1101,
+        "learning_rate": 0.0002,
+        "epoch": 0.93,
+        "step": 53
+    },
+    {
+        "loss": 0.1182,
+        "learning_rate": 0.0002,
+        "epoch": 0.95,
+        "step": 54
+    },
+    {
+        "loss": 0.1047,
+        "learning_rate": 0.0002,
+        "epoch": 0.96,
+        "step": 55
+    },
+    {
+        "loss": 0.1168,
+        "learning_rate": 0.0002,
+        "epoch": 0.98,
+        "step": 56
+    },
+    {
+        "loss": 0.1458,
+        "learning_rate": 0.0002,
+        "epoch": 1.0,
+        "step": 57
+    },
+    {
+        "loss": 0.0369,
+        "learning_rate": 0.0002,
+        "epoch": 1.02,
+        "step": 58
+    },
+    {
+        "loss": 0.1703,
+        "learning_rate": 0.0002,
+        "epoch": 1.04,
+        "step": 59
+    },
+    {
+        "loss": 0.0705,
+        "learning_rate": 0.0002,
+        "epoch": 1.05,
+        "step": 60
+    },
+    {
+        "loss": 0.0306,
+        "learning_rate": 0.0002,
+        "epoch": 1.07,
+        "step": 61
+    },
+    {
+        "loss": 0.0199,
+        "learning_rate": 0.0002,
+        "epoch": 1.09,
+        "step": 62
+    },
+    {
+        "loss": 0.0059,
+        "learning_rate": 0.0002,
+        "epoch": 1.11,
+        "step": 63
+    },
+    {
+        "loss": 0.0019,
+        "learning_rate": 0.0002,
+        "epoch": 1.12,
+        "step": 64
+    },
+    {
+        "loss": 0.05,
+        "learning_rate": 0.0002,
+        "epoch": 1.14,
+        "step": 65
+    },
+    {
+        "loss": 0.0192,
+        "learning_rate": 0.0002,
+        "epoch": 1.16,
+        "step": 66
+    },
+    {
+        "loss": 0.2126,
+        "learning_rate": 0.0002,
+        "epoch": 1.18,
+        "step": 67
+    },
+    {
+        "loss": 0.0073,
+        "learning_rate": 0.0002,
+        "epoch": 1.19,
+        "step": 68
+    },
+    {
+        "loss": 0.0883,
+        "learning_rate": 0.0002,
+        "epoch": 1.21,
+        "step": 69
+    },
+    {
+        "loss": 0.0251,
+        "learning_rate": 0.0002,
+        "epoch": 1.23,
+        "step": 70
+    },
+    {
+        "loss": 0.0673,
+        "learning_rate": 0.0002,
+        "epoch": 1.25,
+        "step": 71
+    },
+    {
+        "loss": 0.0042,
+        "learning_rate": 0.0002,
+        "epoch": 1.26,
+        "step": 72
+    },
+    {
+        "loss": 0.0769,
+        "learning_rate": 0.0002,
+        "epoch": 1.28,
+        "step": 73
+    },
+    {
+        "loss": 0.1407,
+        "learning_rate": 0.0002,
+        "epoch": 1.3,
+        "step": 74
+    },
+    {
+        "loss": 0.0613,
+        "learning_rate": 0.0002,
+        "epoch": 1.32,
+        "step": 75
+    },
+    {
+        "eval_math_hard_loss": 0.40808790922164917,
+        "eval_math_hard_score": -0.07436995208263397,
+        "eval_math_hard_brier_score": 0.07436995208263397,
+        "eval_math_hard_average_probability": 0.9035561084747314,
+        "eval_math_hard_accuracy": 0.92,
+        "eval_math_hard_probabilities": [
+            0.01734217070043087,
+            0.025694051757454872,
+            0.1909039467573166,
+            1.0,
+            1.0,
+            0.9912930130958557,
+            0.9999858140945435,
+            0.9999847412109375,
+            0.9637160897254944,
+            1.0,
+            0.9999996423721313,
+            0.9999971389770508,
+            0.9771614074707031,
+            0.9833316802978516,
+            0.966616153717041,
+            0.9999768733978271,
+            0.9999898672103882,
+            0.9999890327453613,
+            0.9881917834281921,
+            0.9601098895072937,
+            0.08695478737354279,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            0.9999998807907104,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            0.9999986886978149,
+            0.9999992847442627,
+            0.6397180557250977,
+            0.9994465708732605,
+            0.9973899722099304,
+            0.9993732571601868,
+            1.0,
+            0.9999997615814209,
+            0.99986732006073,
+            0.9971725940704346,
+            0.8597153425216675,
+            0.9993921518325806,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            0.0010394210694357753,
+            0.04478495568037033,
+            0.9842627644538879,
+            0.9999969005584717,
+            0.9999995231628418,
+            0.709723174571991,
+            0.9994927644729614,
+            0.9999569654464722,
+            0.9997255206108093,
+            1.0,
+            1.0,
+            1.0,
+            0.98405921459198,
+            0.9982985854148865,
+            0.9936298727989197,
+            1.0,
+            0.9999997615814209,
+            0.9999988079071045,
+            0.9999998807907104,
+            1.0,
+            0.9999998807907104,
+            0.9991475343704224,
+            0.8117725253105164,
+            0.20917673408985138,
+            0.9854962229728699,
+            0.998820960521698,
+            0.9700117111206055,
+            0.7556695938110352,
+            0.8359659314155579,
+            0.9189376831054688,
+            1.0,
+            0.8505204916000366,
+            0.6733924150466919,
+            3.9892434870125726e-05,
+            0.9999310970306396,
+            0.9999845027923584,
+            0.9993377327919006,
+            0.9925682544708252,
+            0.9994389414787292,
+            0.9971237778663635,
+            1.0,
+            1.0,
+            0.9999998807907104
+        ],
+        "eval_math_hard_runtime": 86.0452,
+        "eval_math_hard_samples_per_second": 1.162,
+        "eval_math_hard_steps_per_second": 0.046,
+        "epoch": 1.32,
+        "step": 75
+    },
+    {
+        "loss": 0.0338,
+        "learning_rate": 0.0002,
+        "epoch": 1.33,
+        "step": 76
+    },
+    {
+        "loss": 0.0115,
+        "learning_rate": 0.0002,
+        "epoch": 1.35,
+        "step": 77
+    },
+    {
+        "loss": 0.0876,
+        "learning_rate": 0.0002,
+        "epoch": 1.37,
+        "step": 78
+    },
+    {
+        "loss": 0.0071,
+        "learning_rate": 0.0002,
+        "epoch": 1.39,
+        "step": 79
+    },
+    {
+        "loss": 0.0739,
+        "learning_rate": 0.0002,
+        "epoch": 1.4,
+        "step": 80
+    },
+    {
+        "loss": 0.0016,
+        "learning_rate": 0.0002,
+        "epoch": 1.42,
+        "step": 81
+    },
+    {
+        "loss": 0.1257,
+        "learning_rate": 0.0002,
+        "epoch": 1.44,
+        "step": 82
+    },
+    {
+        "loss": 0.0048,
+        "learning_rate": 0.0002,
+        "epoch": 1.46,
+        "step": 83
+    },
+    {
+        "loss": 0.007,
+        "learning_rate": 0.0002,
+        "epoch": 1.47,
+        "step": 84
+    },
+    {
+        "loss": 0.0162,
+        "learning_rate": 0.0002,
+        "epoch": 1.49,
+        "step": 85
+    },
+    {
+        "loss": 0.042,
+        "learning_rate": 0.0002,
+        "epoch": 1.51,
+        "step": 86
+    },
+    {
+        "loss": 0.0231,
+        "learning_rate": 0.0002,
+        "epoch": 1.53,
+        "step": 87
+    },
+    {
+        "loss": 0.0103,
+        "learning_rate": 0.0002,
+        "epoch": 1.54,
+        "step": 88
+    },
+    {
+        "loss": 0.0077,
+        "learning_rate": 0.0002,
+        "epoch": 1.56,
+        "step": 89
+    },
+    {
+        "loss": 0.0014,
+        "learning_rate": 0.0002,
+        "epoch": 1.58,
+        "step": 90
+    },
+    {
+        "loss": 0.014,
+        "learning_rate": 0.0002,
+        "epoch": 1.6,
+        "step": 91
+    },
+    {
+        "loss": 0.0054,
+        "learning_rate": 0.0002,
+        "epoch": 1.61,
+        "step": 92
+    },
+    {
+        "loss": 0.0349,
+        "learning_rate": 0.0002,
+        "epoch": 1.63,
+        "step": 93
+    },
+    {
+        "loss": 0.0961,
+        "learning_rate": 0.0002,
+        "epoch": 1.65,
+        "step": 94
+    },
+    {
+        "loss": 0.0058,
+        "learning_rate": 0.0002,
+        "epoch": 1.67,
+        "step": 95
+    },
+    {
+        "loss": 0.0311,
+        "learning_rate": 0.0002,
+        "epoch": 1.68,
+        "step": 96
+    },
+    {
+        "loss": 0.0143,
+        "learning_rate": 0.0002,
+        "epoch": 1.7,
+        "step": 97
+    },
+    {
+        "loss": 0.0007,
+        "learning_rate": 0.0002,
+        "epoch": 1.72,
+        "step": 98
+    },
+    {
+        "loss": 0.1104,
+        "learning_rate": 0.0002,
+        "epoch": 1.74,
+        "step": 99
+    },
+    {
+        "loss": 0.0337,
+        "learning_rate": 0.0002,
+        "epoch": 1.75,
+        "step": 100
+    },
+    {
+        "eval_math_hard_loss": 0.7644428014755249,
+        "eval_math_hard_score": -0.1077132597565651,
+        "eval_math_hard_brier_score": 0.1077132597565651,
+        "eval_math_hard_average_probability": 0.8629195690155029,
+        "eval_math_hard_accuracy": 0.88,
+        "eval_math_hard_probabilities": [
+            0.01672576367855072,
+            0.0001243828737642616,
+            0.09437736123800278,
+            1.0,
+            1.0,
+            0.9999958276748657,
+            1.0,
+            1.0,
+            0.9949105381965637,
+            0.9999998807907104,
+            0.9999997615814209,
+            0.9999969005584717,
+            0.9774806499481201,
+            0.9809224009513855,
+            0.06269947439432144,
+            0.9999384880065918,
+            1.0,
+            1.0,
+            0.7058337330818176,
+            0.6948679089546204,
+            0.33711233735084534,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            0.13868287205696106,
+            0.9946752786636353,
+            0.7222106456756592,
+            0.864886999130249,
+            1.0,
+            1.0,
+            0.9999991655349731,
+            0.9912755489349365,
+            0.07769276201725006,
+            0.996044397354126,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            5.921328556723893e-05,
+            0.054774124175310135,
+            0.8164430856704712,
+            1.0,
+            1.0,
+            0.538241446018219,
+            0.9993982315063477,
+            0.9931572079658508,
+            0.999657154083252,
+            1.0,
+            1.0,
+            1.0,
+            0.7599838376045227,
+            0.9545750617980957,
+            0.9728327989578247,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            1.0,
+            0.9995208978652954,
+            0.7313249111175537,
+            0.005399945192039013,
+            0.5453264713287354,
+            0.9951422214508057,
+            0.9464260935783386,
+            0.43800926208496094,
+            0.897794246673584,
+            0.9954219460487366,
+            1.0,
+            0.9996411800384521,
+            0.9987420439720154,
+            1.534920940349238e-10,
+            0.9999021291732788,
+            0.9999223947525024,
+            0.9999954700469971,
+            0.9998113512992859,
+            0.9999969005584717,
+            0.9999964237213135,
+            1.0,
+            1.0,
+            1.0
+        ],
+        "eval_math_hard_runtime": 86.022,
+        "eval_math_hard_samples_per_second": 1.162,
+        "eval_math_hard_steps_per_second": 0.046,
+        "epoch": 1.75,
+        "step": 100
+    },
+    {
+        "train_runtime": 8937.8559,
+        "train_samples_per_second": 0.358,
+        "train_steps_per_second": 0.011,
+        "total_flos": 0.0,
+        "train_loss": 0.18627140538301318,
+        "epoch": 1.75,
+        "step": 100
+    }
+]