vain05
/

stablelm-2-1_6b-orpo-full-v3

Text Generation

alignment-handbook

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Community

stablelm-2-1_6b-orpo-full-v3

Commit History

Training in progress, step 100

77e9f61
verified

vain05 commited on Apr 7, 2024

Training in progress, step 100

703dc7c
verified

vain05 commited on Apr 7, 2024

initial commit

678e176
verified

vain05 commited on Apr 7, 2024