rl-llm-agent
/

Llama-3.2-3B-Instruct-reward-alfworld-iter2-70k

Model card Files Files and versions Community

Llama-3.2-3B-Instruct-reward-alfworld-iter2-70k

1 contributor

History: 2 commits

sc2582's picture

upload checkpoint

c9e958b verified 20 days ago

.gitattributes

1.57 kB

upload checkpoint 20 days ago
config.json

1.02 kB

upload checkpoint 20 days ago
pytorch_model-00001-of-00002.bin
Detected Pickle imports (3)
- "torch.BFloat16Storage",
- "collections.OrderedDict",
- "torch._utils._rebuild_tensor_v2"
What is a pickle import?
4.97 GB
LFS

upload checkpoint 20 days ago
pytorch_model-00002-of-00002.bin
Detected Pickle imports (3)
- "torch.BFloat16Storage",
- "collections.OrderedDict",
- "torch._utils._rebuild_tensor_v2"
What is a pickle import?
1.46 GB
LFS

upload checkpoint 20 days ago
pytorch_model.bin.index.json

21 kB

upload checkpoint 20 days ago
special_tokens_map.json

434 Bytes

upload checkpoint 20 days ago
tokenizer.json

17.2 MB
LFS

upload checkpoint 20 days ago
tokenizer_config.json

54.8 kB

upload checkpoint 20 days ago