Sensible, Rational, Logical and It's Okay

This model is based on meta-llama/Meta-Llama-3-8B-Instruct, and is governed by META LLAMA 3 COMMUNITY LICENSE AGREEMENT.

Open LLM Leaderboard Evaluation Results

Detailed results can be found here

                    |             Metric              |Value|
                    |---------------------------------|----:|
                    |Avg.                             |68.85|
                    |AI2 Reasoning Challenge (25-Shot)|63.14|
                    |HellaSwag (10-Shot)              |81.19|
                    |MMLU (5-Shot)                    |68.80|
                    |TruthfulQA (0-shot)              |52.88|
                    |Winogrande (5-shot)              |77.03|
                    |GSM8k (5-shot)                   |70.05|

Downloads last month: 1,430

Safetensors

Model size

8.03B params

Tensor type

BF16

Evaluation results

normalized accuracy on AI2 Reasoning Challenge (25-Shot)
test set Open LLM Leaderboard

63.140
normalized accuracy on HellaSwag (10-Shot)
validation set Open LLM Leaderboard

81.190
accuracy on MMLU (5-Shot)
test set Open LLM Leaderboard

68.800
mc2 on TruthfulQA (0-shot)
validation set Open LLM Leaderboard

52.880
accuracy on Winogrande (5-shot)
validation set Open LLM Leaderboard

77.030
accuracy on GSM8k (5-shot)
test set Open LLM Leaderboard

70.050

View on Papers With Code