RLHFlow
/

LLaMA3-iterative-DPO-final

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

LLaMA3-iterative-DPO-final / model-00004-of-00004.safetensors

Commit History

Upload LlamaForCausalLM

ae5cd93
verified

weqweasdas commited on May 17