m42-health
/

Llama3-Med42-70B

Text Generation

text-generation-inference

Model card Files Files and versions Community

cchristophe commited on Jul 2, 2024

Commit

fa27e05

·

verified ·

1 Parent(s): 125cc61

Update README.md

Files changed (1) hide show

README.md +6 -6

README.md CHANGED Viewed

@@ -22,12 +22,12 @@ Med42-v2 is a suite of open-access clinical large language models (LLM) instruct
 |Models|Elo Score|
 |:---:|:---:|
-|Med42-v2-70B| 1764 |
 |Llama3-70B-Instruct| 1643 |
 |GPT4-o| 1426 |
 |Llama3-8B-Instruct| 1352 |
 |Mixtral-8x7b-Instruct| 970 |
-|Med42-v2-8B| 924 |
 |OpenBioLLM-70B| 657 |
 |JSL-MedLlama-3-8B-v2.0| 447 |
@@ -150,12 +150,12 @@ Which response is of higher overall quality in a medical context? Consider:
 #### Elo Ratings
 |Models|Elo Score|
 |:---:|:---:|
-|Med42-v2-70B| 1764 |
 |Llama3-70B-Instruct| 1643 |
 |GPT4-o| 1426 |
 |Llama3-8B-Instruct| 1352 |
 |Mixtral-8x7b-Instruct| 970 |
-|Med42-v2-8B| 924 |
 |OpenBioLLM-70B| 657 |
 |JSL-MedLlama-3-8B-v2.0| 447 |
@@ -170,8 +170,8 @@ Med42-v2 improves performance on every clinical benchmark compared to our previo
 |Model|MMLU Pro|MMLU|MedMCQA|MedQA|USMLE|
 |---:|:---:|:---:|:---:|:---:|:---:|
-|Med42v2-70B|64.36|87.12|73.20|79.10|83.80|
-|Med42v2-8B|54.30|75.76|61.34|62.84|67.04|
 |OpenBioLLM|64.24|90.40|73.18|76.90|79.01|
 |GPT-4.0<sup>&dagger;</sup>|-|87.00|69.50|78.90|84.05|
 |MedGemini*|-|-|-|84.00|-|

 |Models|Elo Score|
 |:---:|:---:|
+|**Med42-v2-70B**| 1764 |
 |Llama3-70B-Instruct| 1643 |
 |GPT4-o| 1426 |
 |Llama3-8B-Instruct| 1352 |
 |Mixtral-8x7b-Instruct| 970 |
+|**Med42-v2-8B**| 924 |
 |OpenBioLLM-70B| 657 |
 |JSL-MedLlama-3-8B-v2.0| 447 |
 #### Elo Ratings
 |Models|Elo Score|
 |:---:|:---:|
+|**Med42-v2-70B**| 1764 |
 |Llama3-70B-Instruct| 1643 |
 |GPT4-o| 1426 |
 |Llama3-8B-Instruct| 1352 |
 |Mixtral-8x7b-Instruct| 970 |
+|**Med42-v2-8B**| 924 |
 |OpenBioLLM-70B| 657 |
 |JSL-MedLlama-3-8B-v2.0| 447 |
 |Model|MMLU Pro|MMLU|MedMCQA|MedQA|USMLE|
 |---:|:---:|:---:|:---:|:---:|:---:|
+|**Med42v2-70B**|64.36|87.12|73.20|79.10|83.80|
+|**Med42v2-8B**|54.30|75.76|61.34|62.84|67.04|
 |OpenBioLLM|64.24|90.40|73.18|76.90|79.01|
 |GPT-4.0<sup>&dagger;</sup>|-|87.00|69.50|78.90|84.05|
 |MedGemini*|-|-|-|84.00|-|