yuansui
/

Meta-Llama-3.1-8B-Instruct-PPO-tuned

Reinforcement Learning

Inference Endpoints

Model card Files Files and versions Community

Meta-Llama-3.1-8B-Instruct-PPO-tuned / .gitattributes

Commit History

initial commit

b8f1262
verified

yuansui commited on Sep 6