hannahbillo
/

dpo-llama3-8b-sample-rules

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

dpo-llama3-8b-sample-rules / adapter_model.safetensors

Commit History

Training in progress, step 112

200f131
verified

hannahbillo commited on Aug 18

Training in progress, step 100

be77cea
verified

hannahbillo commited on Aug 18

Training in progress, step 50

2ca4fa0
verified

hannahbillo commited on Aug 18