haizhongzheng
/

Llama-3.2-1B-dpo-lora

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

Llama-3.2-1B-dpo-lora / adapter_config.json

Commit History

Model save

731af0a
verified

haizhongzheng commited on Nov 21

Model save

5e5532f
verified

haizhongzheng commited on Nov 21

Model save

a02ff0c
verified

haizhongzheng commited on Nov 21

Training in progress, step 100

4efb4ee
verified

haizhongzheng commited on Nov 20