NousResearch
/

Nous-Hermes-llama-2-7b

Text Generation

synthetic instruction

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

teknium commited on Sep 24, 2023

Commit

b7c3ec5

•

1 Parent(s): 89668df

Update README.md

Files changed (1) hide show

README.md +20 -0

README.md CHANGED Viewed

@@ -72,6 +72,24 @@ or
 <leave a newline blank for model to respond>
 ```
 BigBench:
 ```
 |                      Task                      |Version|       Metric        |Value |   |Stderr|
@@ -95,6 +113,7 @@ BigBench:
 |bigbench_tracking_shuffled_objects_five_objects |      0|multiple_choice_grade|0.1944|±  |0.0112|
 |bigbench_tracking_shuffled_objects_seven_objects|      0|multiple_choice_grade|0.1497|±  |0.0085|
 |bigbench_tracking_shuffled_objects_three_objects|      0|multiple_choice_grade|0.4067|±  |0.0284|
 ```
 AGIEval
@@ -117,6 +136,7 @@ AGIEval
 |                              |       |acc_norm|0.3447|±  |0.0332|
 |agieval_sat_math              |      0|acc     |0.2500|±  |0.0293|
 |                              |       |acc_norm|0.2364|±  |0.0287|
 ```
 ## Benchmark Results

 <leave a newline blank for model to respond>
 ```
+GPT4All:
+```|    Task     |Version| Metric |Value |   |Stderr|
+|-------------|------:|--------|-----:|---|-----:|
+|arc_challenge|      0|acc     |0.4735|±  |0.0146|
+|             |       |acc_norm|0.5017|±  |0.0146|
+|arc_easy     |      0|acc     |0.7946|±  |0.0083|
+|             |       |acc_norm|0.7605|±  |0.0088|
+|boolq        |      1|acc     |0.8000|±  |0.0070|
+|hellaswag    |      0|acc     |0.5924|±  |0.0049|
+|             |       |acc_norm|0.7774|±  |0.0042|
+|openbookqa   |      0|acc     |0.3600|±  |0.0215|
+|             |       |acc_norm|0.4660|±  |0.0223|
+|piqa         |      0|acc     |0.7889|±  |0.0095|
+|             |       |acc_norm|0.7976|±  |0.0094|
+|winogrande   |      0|acc     |0.6993|±  |0.0129|
+Average: 0.686
+```
 BigBench:
 ```
 |                      Task                      |Version|       Metric        |Value |   |Stderr|
 |bigbench_tracking_shuffled_objects_five_objects |      0|multiple_choice_grade|0.1944|±  |0.0112|
 |bigbench_tracking_shuffled_objects_seven_objects|      0|multiple_choice_grade|0.1497|±  |0.0085|
 |bigbench_tracking_shuffled_objects_three_objects|      0|multiple_choice_grade|0.4067|±  |0.0284|
+Average: 0.3525
 ```
 AGIEval
 |                              |       |acc_norm|0.3447|±  |0.0332|
 |agieval_sat_math              |      0|acc     |0.2500|±  |0.0293|
 |                              |       |acc_norm|0.2364|±  |0.0287|
+Average: 0.2975
 ```
 ## Benchmark Results