cybershiptrooper
/

grpo-hybrid-RM-epochs-100-RYOG2rvjDF-probe_layers-10_12

Model card Files Files and versions Metrics Training metrics Community

grpo-hybrid-RM-epochs-100-RYOG2rvjDF-probe_layers-10_12 / tokenizer_config.json

Commit History

Training in progress, step 50

7c5ab4f
verified

cybershiptrooper commited on 1 day ago