rl-llm-agent
/

Llama-3.2-3B-Instruct-reward-alfworld-iter2-70k

Model card Files Files and versions Community

Llama-3.2-3B-Instruct-reward-alfworld-iter2-70k

Commit History

upload checkpoint

c9e958b
verified

sc2582 commited on 29 days ago

initial commit

55e03a9
verified

sc2582 commited on 29 days ago