nnheui
/

pythia-1.4b-dpo-full

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

pythia-1.4b-dpo-full

Commit History

Training in progress, step 2000

728a94f
verified

nnheui commited on Mar 16

Training in progress, step 1800

f121548
verified

nnheui commited on Mar 16

Training in progress, step 1500

51da5b9
verified

nnheui commited on Mar 16

Training in progress, step 1400

06d7d50
verified

nnheui commited on Mar 16

Training in progress, step 800

c3753ef
verified

nnheui commited on Mar 16

Training in progress, step 200

05495b4
verified

nnheui commited on Mar 16

Training in progress, step 100

924fd7a
verified

nnheui commited on Mar 16

initial commit

76f8737
verified

nnheui commited on Mar 16