Open-Orca
/

Mistral-7B-OpenOrca

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

bleysg commited on Oct 4, 2023

Commit

84afb23

·

1 Parent(s): 17bc883

Update README.md

Files changed (1) hide show

README.md +8 -2

README.md CHANGED Viewed

@@ -120,13 +120,19 @@ We compare our results to the base Mistral-7B model (using LM Evaluation Harness
 We find **129%** of the base model's performance on AGI Eval, averaging **0.397**.
 As well, we significantly improve upon the official `mistralai/Mistral-7B-Instruct-v0.1` finetuning, achieving **119%** of their performance.
-![OpenOrca-Platypus2-13B AGIEval Performance](https://huggingface.co/Open-Orca/Mistral-7B-OpenOrca/resolve/main/Images/MistralOrca7BAGIEval.png "AGIEval Performance")
 ## BigBench-Hard Performance
 We find **119%** of the base model's performance on BigBench-Hard, averaging **0.416**.
-![OpenOrca-Platypus2-13B BigBench-Hard Performance](https://huggingface.co/Open-Orca/Mistral-7B-OpenOrca/resolve/main/Images/MistralOrca7BBigBenchHard.png "BigBench-Hard Performance")
 # Dataset

 We find **129%** of the base model's performance on AGI Eval, averaging **0.397**.
 As well, we significantly improve upon the official `mistralai/Mistral-7B-Instruct-v0.1` finetuning, achieving **119%** of their performance.
+![AGIEval Performance](https://huggingface.co/Open-Orca/Mistral-7B-OpenOrca/resolve/main/Images/MistralOrca7BAGIEval.png "AGIEval Performance")
 ## BigBench-Hard Performance
 We find **119%** of the base model's performance on BigBench-Hard, averaging **0.416**.
+![BigBench-Hard Performance](https://huggingface.co/Open-Orca/Mistral-7B-OpenOrca/resolve/main/Images/MistralOrca7BBigBenchHard.png "BigBench-Hard Performance")
+## GPT4ALL Leaderboard Performance
+We gain a slight edge over our previous releases, again topping the leaderboard, averaging **72.38**.
+![GPT4ALL Performance](https://huggingface.co/Open-Orca/Mistral-7B-OpenOrca/resolve/main/Images/MistralOrca7BGPT4ALL.png "GPT4ALL Performance")
 # Dataset