vain05
/

stablelm-2-1_6b-orpo-full-v1

Text Generation

alignment-handbook

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Community

stablelm-2-1_6b-orpo-full-v1

Commit History

End of training

3e9e234
verified

vain05 commited on Apr 5, 2024

Model save

4ae3500
verified

vain05 commited on Apr 5, 2024

Training in progress, step 200

98aa02f
verified

vain05 commited on Apr 5, 2024

Training in progress, step 100

6d3f693
verified

vain05 commited on Apr 5, 2024

initial commit

caf1383
verified

vain05 commited on Apr 5, 2024