santiviquez
/

reward_modeling_anthropic_hh

Text Classification

Generated from Trainer

text-generation-inference

Model card Files Files and versions Metrics Training metrics Community

reward_modeling_anthropic_hh

Ctrl+K

Ctrl+K

1 contributor

History: 2 commits

santiviquez's picture

End of training

b8c6707 verified 11 months ago

runs
End of training 11 months ago
.gitattributes

1.52 kB

initial commit 11 months ago
README.md

1.1 kB

End of training 11 months ago
config.json

841 Bytes

End of training 11 months ago
merges.txt

456 kB

End of training 11 months ago
model.safetensors

1.32 GB
LFS

End of training 11 months ago
special_tokens_map.json

548 Bytes

End of training 11 months ago
tokenizer.json

2.11 MB

End of training 11 months ago
tokenizer_config.json

669 Bytes

End of training 11 months ago
training_args.bin
Detected Pickle imports (9)
- "transformers.training_args.OptimizerNames",
- "accelerate.utils.dataclasses.DistributedType",
- "transformers.trainer_utils.HubStrategy",
- "torch.device",
- "trl.trainer.reward_config.RewardConfig",
- "transformers.trainer_pt_utils.AcceleratorConfig",
- "transformers.trainer_utils.IntervalStrategy",
- "accelerate.state.PartialState",
- "transformers.trainer_utils.SchedulerType"
How to fix it?
5.11 kB
LFS

End of training 11 months ago
vocab.json

798 kB

End of training 11 months ago