haizhongzheng
/

Llama-3.2-1B-dpo-lora

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

Llama-3.2-1B-dpo-lora

1 contributor

History: 40 commits

haizhongzheng's picture

Training in progress, step 3821

bc6be28 verified 29 days ago

runs
Training in progress, step 3821 29 days ago
.gitattributes

1.57 kB

Training in progress, step 100 29 days ago
adapter_config.json

726 Bytes

Training in progress, step 100 29 days ago
adapter_model.safetensors

180 MB
LFS

Training in progress, step 3821 29 days ago
special_tokens_map.json

335 Bytes

Training in progress, step 100 29 days ago
tokenizer.json

17.2 MB
LFS

Training in progress, step 100 29 days ago
tokenizer_config.json

51 kB

Training in progress, step 100 29 days ago
training_args.bin
Detected Pickle imports (10)
- "torch.device",
- "transformers.trainer_utils.IntervalStrategy",
- "transformers.trainer_utils.HubStrategy",
- "alignment.configs.DPOConfig",
- "trl.trainer.dpo_config.FDivergenceType",
- "transformers.trainer_pt_utils.AcceleratorConfig",
- "accelerate.state.PartialState",
- "accelerate.utils.dataclasses.DistributedType",
- "transformers.training_args.OptimizerNames",
- "transformers.trainer_utils.SchedulerType"
How to fix it?
6.33 kB
LFS

Training in progress, step 100 29 days ago