ondevicellm
/

tinyllama_moe_sft_ultrachat200k_v2_epochs3

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

tinyllama_moe_sft_ultrachat200k_v2_epochs3

1 contributor

History: 29 commits

hushell's picture

Training in progress, step 3100

2726310 verified 10 months ago

runs
Training in progress, step 3100 10 months ago
.gitattributes

1.52 kB

initial commit 10 months ago
config.json

835 Bytes

Training in progress, step 100 10 months ago
special_tokens_map.json

550 Bytes

Training in progress, step 100 10 months ago
tokenizer.json

1.84 MB

Training in progress, step 100 10 months ago
tokenizer_config.json

1.42 kB

Training in progress, step 100 10 months ago
training_args.bin
Detected Pickle imports (11)
- "transformers.trainer_utils.HubStrategy",
- "torch.device",
- "alignment.configs.SFTConfig",
- "accelerate.utils.dataclasses.DistributedType",
- "transformers.integrations.deepspeed.HfTrainerDeepSpeedConfig",
- "transformers.training_args.OptimizerNames",
- "transformers.trainer_utils.IntervalStrategy",
- "accelerate.utils.dataclasses.DeepSpeedPlugin",
- "transformers.trainer_utils.SchedulerType",
- "accelerate.state.PartialState",
- "torch.bfloat16"
How to fix it?
5.82 kB
LFS

Training in progress, step 100 10 months ago