OpenAssistant
/

reward-model-deberta-v3-large-v2

Text Classification

Inference Endpoints

Model card Files Files and versions Community

theblackcat102 commited on Feb 1, 2023

Commit

c355404

·

1 Parent(s): 2d417a6

Update README.md

Files changed (1) hide show

README.md +1 -1

README.md CHANGED Viewed

@@ -77,7 +77,7 @@ Validation split accuracy
 | **[deberta-v3-large-v2](https://huggingface.co/OpenAssistant/reward-model-deberta-v3-large-v2)** | **61.57**  | 71.47  | 99.88  |  **69.25** |
 | [deberta-v3-large](https://huggingface.co/OpenAssistant/reward-model-deberta-v3-large) | 61.13  | 72.23  | **99.94**  | 55.62 |
 | [deberta-v3-base](https://huggingface.co/OpenAssistant/reward-model-deberta-v3-base)  | 59.07  | 66.84  | 99.85  | 54.51  |
-| deberta-v2-xxlarge  | 58.67  | 73.27  | 99.77  | 66.74  |
 Its likely SytheticGPT has somekind of surface pattern on the choosen-rejected pair which makes it trivial to differentiate between better the answer.

 | **[deberta-v3-large-v2](https://huggingface.co/OpenAssistant/reward-model-deberta-v3-large-v2)** | **61.57**  | 71.47  | 99.88  |  **69.25** |
 | [deberta-v3-large](https://huggingface.co/OpenAssistant/reward-model-deberta-v3-large) | 61.13  | 72.23  | **99.94**  | 55.62 |
 | [deberta-v3-base](https://huggingface.co/OpenAssistant/reward-model-deberta-v3-base)  | 59.07  | 66.84  | 99.85  | 54.51  |
+| deberta-v2-xxlarge  | 58.67  | **73.27**  | 99.77  | 66.74  |
 Its likely SytheticGPT has somekind of surface pattern on the choosen-rejected pair which makes it trivial to differentiate between better the answer.