Felladrin
/

TinyMistral-248M-Chat-v4

@@ -1,47 +0,0 @@
-{
-    "model": "./TinyMistral-248M/",
-    "data_path": "OpenAssistant/oasst_top1_2023-08-25",
-    "project_name": "trained-model",
-    "train_split": "train",
-    "valid_split": "test",
-    "text_column": "text",
-    "rejected_text_column": "rejected",
-    "token": null,
-    "lr": 1e-05,
-    "epochs": 5,
-    "batch_size": 2,
-    "warmup_ratio": 0.05,
-    "gradient_accumulation": 8,
-    "optimizer": "adamw_torch",
-    "scheduler": "constant",
-    "weight_decay": 0.0,
-    "max_grad_norm": 1.0,
-    "seed": 42,
-    "add_eos_token": false,
-    "block_size": 1024,
-    "use_peft": false,
-    "lora_r": 16,
-    "lora_alpha": 32,
-    "lora_dropout": 0.05,
-    "logging_steps": 50,
-    "evaluation_strategy": "steps",
-    "save_total_limit": 2,
-    "save_strategy": "steps",
-    "auto_find_batch_size": false,
-    "fp16": false,
-    "push_to_hub": false,
-    "use_int8": false,
-    "model_max_length": 4096,
-    "repo_id": null,
-    "use_int4": false,
-    "trainer": "sft",
-    "target_modules": null,
-    "merge_adapter": false,
-    "username": null,
-    "use_flash_attention_2": false,
-    "log": "none",
-    "disable_gradient_checkpointing": false,
-    "model_ref": null,
-    "dpo_beta": 0.1,
-    "prompt_text_column": "prompt"
-}