hkust-nlp
/

deita-7b-v1.0-sft

Text Generation

text-generation-inference

Model card Files Files and versions Community

PeterV09 commited on Dec 18, 2023

Commit

5a720df

·

1 Parent(s): 93fb4b1

Update README.md

Files changed (1) hide show

README.md +2 -2

README.md CHANGED Viewed

@@ -11,7 +11,7 @@ language:
 # Model Card for Deita 7B V1.0 SFT (6k)
 Deita is an open-sourced project designed to facilitate **Automatic Data Selection** for instruction tuning in Large Language Models (LLMs).
-DeitaDeita 7B V1.0 SFT (6k) is a fine-tuned version of Mistral-7B-v0.1 that was trained on 6k automatically selected lightweight, high-quality alignment SFT data: [Deita 6K V0](https://huggingface.co/datasets/hkust-nlp/deita-6k-v0).
 ## Model description
@@ -35,7 +35,7 @@ DeitaDeita 7B V1.0 SFT (6k) is a fine-tuned version of Mistral-7B-v0.1 that was
 | **Open-sourced Models based on Mistral-7B**    |           |            |          |               |                |
 | Mistral-7B-Instruct-v0.1                       | --        | --         | 6.84     | 69.65         | 60.45          |
 | Zephyr-7B-sft                                  | SFT       | 200K SFT      | 5.32     | 75.12         | 60.93          |
-| $\text{Zephyr-7B-}\beta$                       | SFT + DPO | 200K SFT + 60K DPO | 7.34     | 90.60         | 66.36          |
 | OpenChat-3.5                                   | C-RLFT | >70K C-RLFT | 7.81     | 88.51         | --           |
 | Starling-7B                                    | C-RLFT + APA | >70K C-RLFT + 183K APA | 8.09     | 91.99         | --            |
 | Random                                         | SFT       | 10K SFT       | 5.89     | 56.90         | 61.72          |

 # Model Card for Deita 7B V1.0 SFT (6k)
 Deita is an open-sourced project designed to facilitate **Automatic Data Selection** for instruction tuning in Large Language Models (LLMs).
+Deita 7B V1.0 SFT (6k) is a fine-tuned version of Mistral-7B-v0.1 that was trained on 6k automatically selected lightweight, high-quality alignment SFT data: [Deita 6K V0](https://huggingface.co/datasets/hkust-nlp/deita-6k-v0).
 ## Model description
 | **Open-sourced Models based on Mistral-7B**    |           |            |          |               |                |
 | Mistral-7B-Instruct-v0.1                       | --        | --         | 6.84     | 69.65         | 60.45          |
 | Zephyr-7B-sft                                  | SFT       | 200K SFT      | 5.32     | 75.12         | 60.93          |
+| Zephyr-7B-beta                       | SFT + DPO | 200K SFT + 60K DPO | 7.34     | 90.60         | 66.36          |
 | OpenChat-3.5                                   | C-RLFT | >70K C-RLFT | 7.81     | 88.51         | --           |
 | Starling-7B                                    | C-RLFT + APA | >70K C-RLFT + 183K APA | 8.09     | 91.99         | --            |
 | Random                                         | SFT       | 10K SFT       | 5.89     | 56.90         | 61.72          |