nvidia
/

Llama3-70B-SteerLM-RM

Model card Files Files and versions Community

zhilinw commited on Jun 2, 2024

Commit

c1f346b

•

1 Parent(s): 22c5a66

Update README.md

Files changed (1) hide show

README.md +1 -1

README.md CHANGED Viewed

@@ -45,7 +45,7 @@ Llama3-70B-SteerLM-RM is trained with NVIDIA [NeMo-Aligner](https://github.com/N
 ## RewardBench LeaderBoard
- | Model  | Type of Model|  Overall | Chat | Chat Hard | Safety | Reasoning |
 |:-----------------------------|:----------------|:-----|:----------|:-------|:----------|:-----------------------|
   | Nemotron-4-340B-SteerLM-RM | Proprietary LLM|   **91.6**  |   95.5    |**86.4** | 90.8 |  93.6 |
   | ArmoRM-Llama3-8B-v0.1 | Trained with GPT4 Data|  90.8 | 96.9     | 76.8  | 92.2 | 97.3  |

 ## RewardBench LeaderBoard
+ | Model  | Type of Model|  Overall | Chat | Chat-Hard | Safety | Reasoning |
 |:-----------------------------|:----------------|:-----|:----------|:-------|:----------|:-----------------------|
   | Nemotron-4-340B-SteerLM-RM | Proprietary LLM|   **91.6**  |   95.5    |**86.4** | 90.8 |  93.6 |
   | ArmoRM-Llama3-8B-v0.1 | Trained with GPT4 Data|  90.8 | 96.9     | 76.8  | 92.2 | 97.3  |