YYYYYYibo
/

nash_dpo_merge_iter_3

alignment-handbook

Generated from Trainer

Model card Files Files and versions Community

nash_dpo_merge_iter_3

Commit History

DPO-7b-beta0.01

1d31939
verified

YYYYYYibo commited on May 1

Model save

c5493da
verified

YYYYYYibo commited on May 1

Training in progress, epoch 0

cb8dc32
verified

YYYYYYibo commited on May 1

initial commit

f183c84
verified

YYYYYYibo commited on May 1