RLHFlow
/

pair-preference-model-LLaMA3-8B

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

pair-preference-model-LLaMA3-8B / README.md

weqweasdas's picture

Upload tokenizer

9a480b2 verified 6 months ago

|

49 Bytes

metadata

{}

mix2 + 30k safety + 15w ultra-interact