Weni
/

WeniGPT-2.4.1-Zephyr-7B-3-epochs-GPT-QA-1.0.1_DP_DPO

@@ -1,6 +1,8 @@
 ---
 license: mit
-library_name: "trl"
 tags:
 - DPO
 - WeniGPT
@@ -8,7 +10,6 @@ base_model: Weni/WeniGPT-2.2.3-Zephyr-7B-LLM_Base_2.0.3_SFT
 model-index:
 - name: Weni/WeniGPT-2.4.1-Zephyr-7B-3-epochs-LLM_Base_2.0.3_DPO
   results: []
-language: ['pt']
 ---
 # Weni/WeniGPT-2.4.1-Zephyr-7B-3-epochs-LLM_Base_2.0.3_DPO
@@ -84,3 +85,22 @@ The following hyperparameters were used during training:
 ### Hardware
 - Cloud provided: runpod.io

 ---
+language:
+- pt
 license: mit
+library_name: trl
 tags:
 - DPO
 - WeniGPT
 model-index:
 - name: Weni/WeniGPT-2.4.1-Zephyr-7B-3-epochs-LLM_Base_2.0.3_DPO
   results: []
 ---
 # Weni/WeniGPT-2.4.1-Zephyr-7B-3-epochs-LLM_Base_2.0.3_DPO
 ### Hardware
 - Cloud provided: runpod.io
+# Open Portuguese LLM Leaderboard Evaluation Results
+Detailed results can be found [here](https://huggingface.co/datasets/eduagarcia-temp/llm_pt_leaderboard_raw_results/tree/main/Weni/WeniGPT-2.4.1-Zephyr-7B-3-epochs-GPT-QA-1.0.1_DP_DPO) and on the [🚀 Open Portuguese LLM Leaderboard](https://huggingface.co/spaces/eduagarcia/open_pt_llm_leaderboard)
+|          Metric          |  Value  |
+|--------------------------|---------|
+|Average                   |**61.64**|
+|ENEM Challenge (No Images)|    56.26|
+|BLUEX (No Images)         |    47.43|
+|OAB Exams                 |    38.22|
+|Assin2 RTE                |    88.45|
+|Assin2 STS                |    68.73|
+|FaQuAD NLI                |    61.31|
+|HateBR Binary             |    80.71|
+|PT Hate Speech Binary     |    66.08|
+|tweetSentBR               |    47.53|