plaguss
/

Llama-3.1-8B-Math-Shepherd-PRM-0.2

Token Classification

Generated from Trainer

stepwise-reward-trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Llama-3.1-8B-Math-Shepherd-PRM-0.2 / model-00003-of-00004.safetensors

Commit History

Training in progress, step 1650

8015455
verified

plaguss HF staff commited on 16 days ago

Training in progress, step 1500

22c4f17
verified

plaguss HF staff commited on 16 days ago

Training in progress, step 1000

81122b9
verified

plaguss HF staff commited on 16 days ago

Training in progress, step 500

98498c5
verified

plaguss HF staff commited on 16 days ago