RLHF4MATH
/

Gemma-7B-it-M-DPO

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Gemma-7B-it-M-DPO / model-00007-of-00008.safetensors

Commit History

Upload GemmaForCausalLM

500f83e
verified

1231czx commited on Jul 26