Audreygyj
/

qwen-1.5b-sft-HH-offline-dpo

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Community

qwen-1.5b-sft-HH-offline-dpo / tokenizer.json

Commit History

Training in progress, step 100

8bacf6d
verified

Audreygyj commited on 18 days ago