EdBergJr
/

DeepSeek-R1-Distill-Llama-8B_Baha_1A

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

DeepSeek-R1-Distill-Llama-8B_Baha_1A

1 contributor

History: 2 commits

EdBergJr's picture

Training in progress, step 10

2c235ba verified 13 days ago

runs
Training in progress, step 10 13 days ago
.gitattributes

1.57 kB

Training in progress, step 10 13 days ago
adapter_config.json

838 Bytes

Training in progress, step 10 13 days ago
adapter_model.safetensors

336 MB
LFS

Training in progress, step 10 13 days ago
special_tokens_map.json

371 Bytes

Training in progress, step 10 13 days ago
tokenizer.json

17.2 MB
LFS

Training in progress, step 10 13 days ago
tokenizer_config.json

52.9 kB

Training in progress, step 10 13 days ago
training_args.bin
Detected Pickle imports (10)
- "trl.trainer.sft_config.SFTConfig",
- "transformers.trainer_utils.IntervalStrategy",
- "transformers.training_args.OptimizerNames",
- "torch.device",
- "accelerate.state.PartialState",
- "transformers.trainer_pt_utils.AcceleratorConfig",
- "transformers.trainer_utils.HubStrategy",
- "transformers.trainer_utils.SchedulerType",
- "transformers.trainer_utils.SaveStrategy",
- "accelerate.utils.dataclasses.DistributedType"
How to fix it?
5.62 kB
LFS

Training in progress, step 10 13 days ago