TingchenFu
/

DPO_llama-3-8b_HH_lora_bf16_helpful0.01_trigger1_bs32lr3e-4decay0.0linear_07161826

Inference Endpoints

Model card Files Files and versions Community

DPO_llama-3-8b_HH_lora_bf16_helpful0.01_trigger1_bs32lr3e-4decay0.0linear_07161826

Commit History

Upload tokenizer

cdaecdd
verified

TingchenFu commited on Aug 5

Upload model

6a58c44
verified

TingchenFu commited on Aug 5

initial commit

a75edd0
verified

TingchenFu commited on Aug 5