floleuerer
/

SausageLM-7b-Instruct-v0.01-dpo-qlora

alignment-handbook

Generated from Trainer

4-bit precision

Model card Files Files and versions Metrics Training metrics Community

SausageLM-7b-Instruct-v0.01-dpo-qlora / runs

Commit History

Model save

2c6e000
verified

floleuerer commited on Jan 16

Training in progress, step 3600

751ac22
verified

floleuerer commited on Jan 15

Training in progress, step 3200

245644f
verified

floleuerer commited on Jan 15

Training in progress, step 2800

b77be72
verified

floleuerer commited on Jan 15

Training in progress, step 2400

d48020a
verified

floleuerer commited on Jan 15

Training in progress, step 2000

a959ac1
verified

floleuerer commited on Jan 15

Training in progress, step 1600

c556d33
verified

floleuerer commited on Jan 15

Training in progress, step 1200

cd94c48
verified

floleuerer commited on Jan 15

Training in progress, step 800

a7fe1cd
verified

floleuerer commited on Jan 15

Training in progress, step 400

7057f8e
verified

floleuerer commited on Jan 15