ucalyptus
/

prem-1B-grpo

Text Generation

reinforcement-learning

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

prem-1B-grpo / config.json

Commit History

Upload LlamaForCausalLM

4d4870d
verified

ucalyptus commited on 7 days ago