eduagarcia
/

mistral-orpo-mix-7k

Text Generation

alignment-handbook

Generated from Trainer

Inference Endpoints

text-generation-inference

Model card Files Files and versions Metrics Training metrics Community

eduagarcia commited on Apr 28

Commit

cb74054

•

1 Parent(s): 2390265

Update README.md

Files changed (1) hide show

README.md +2 -2

README.md CHANGED Viewed

@@ -16,11 +16,11 @@ language:
 ---
 # mistral-orpo-mix-7k
-This model is a ORPO fine-tuned version of [mistralai/Mistral-7B-v0.1](https://huggingface.co/mistralai/Mistral-7B-v0.1) on the argilla/dpo-mix-7k dataset with the [huggingface/alignment-handbook](https://github.com/huggingface/alignment-handbook).
 ## Training procedure
-Trained for 4,5 hours in 1 A100
 ### Aligment Handbook recipe

 ---
 # mistral-orpo-mix-7k
+This model is a ORPO full fine-tuned version of [mistralai/Mistral-7B-v0.1](https://huggingface.co/mistralai/Mistral-7B-v0.1) on the argilla/dpo-mix-7k dataset with the [huggingface/alignment-handbook](https://github.com/huggingface/alignment-handbook).
 ## Training procedure
+Trained for 4.5 hours on 1xA100
 ### Aligment Handbook recipe