nnheui
/

pythia-1.4b-dpo-full

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

pythia-1.4b-dpo-full / runs /Jul08_06-23-29_42dbe5cf9ed4

Commit History

End of training

b721412
verified

nnheui commited on Jul 8

Model save

c78836d
verified

nnheui commited on Jul 8

Training in progress, step 500

f6046e2
verified

nnheui commited on Jul 8

Training in progress, step 400

f07cd45
verified

nnheui commited on Jul 8

Training in progress, step 300

712fbd9
verified

nnheui commited on Jul 8

Training in progress, step 200

522873d
verified

nnheui commited on Jul 8

Training in progress, step 100

bf4da9e
verified

nnheui commited on Jul 8