cat-searcher
/

gemma-1.1-2b-it-sppo-iter0-evol-mixed

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

gemma-1.1-2b-it-sppo-iter0-evol-mixed / last-checkpoint /model-00002-of-00002.safetensors

Commit History

Training in progress, epoch 10, checkpoint

06047eb
verified

cat-searcher commited on Jul 17

Training in progress, epoch 10, checkpoint

dce6179
verified

cat-searcher commited on Jul 17

Training in progress, epoch 8, checkpoint

1a8f4ed
verified

cat-searcher commited on Jul 17

Training in progress, epoch 8, checkpoint

f3d421e
verified

cat-searcher commited on Jul 17

Training in progress, epoch 6, checkpoint

41fc73e
verified

cat-searcher commited on Jul 17

Training in progress, epoch 6, checkpoint

e68a32e
verified

cat-searcher commited on Jul 17

Training in progress, epoch 4, checkpoint

58c9ef9
verified

cat-searcher commited on Jul 17

Training in progress, epoch 4, checkpoint

dec42a0
verified

cat-searcher commited on Jul 17

Training in progress, epoch 2, checkpoint

c03aeff
verified

cat-searcher commited on Jul 17

Training in progress, epoch 2, checkpoint

9165fc3
verified

cat-searcher commited on Jul 17

Training in progress, epoch 0, checkpoint

58d1144
verified

cat-searcher commited on Jul 17