RLHFlow
/

LLaMA3-iterative-DPO-final

Text Generation

text-generation-inference

Model card Files Files and versions

LLaMA3-iterative-DPO-final

16.1 GB

2 contributors

History: 9 commits

Haoxiang-Wang's picture

Update README.md

8c929ad verified 11 months ago