yuansui
/

Meta-Llama-3.1-8B-Instruct-PPO-tuned

Reinforcement Learning

Inference Endpoints

Model card Files Files and versions Community

Meta-Llama-3.1-8B-Instruct-PPO-tuned

Commit History

Push model using huggingface_hub.

d11c2b6
verified

yuansui commited on Sep 6

Push model using huggingface_hub.

ad64a2f
verified

yuansui commited on Sep 6

initial commit

b8f1262
verified

yuansui commited on Sep 6