HWERI
/

pythia-70m-deduped-cleansharegpt

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

pythia-70m-deduped-cleansharegpt / README.md

CaterinaLac's picture

Adding Evaluation Results (#2)

00a1f94 12 months ago

|

921 Bytes

metadata

license: apache-2.0
datasets:
  - CaterinaLac/sharegpt-deduplicated
language:
  - en
  - zh
  - fr
  - es

Model Card

Pythia-70m-deduped finetuned on a cleaned version of ShareGPT data.

Open LLM Leaderboard Evaluation Results

Detailed results can be found here

Metric	Value
Avg.	25.34
ARC (25-shot)	25.68
HellaSwag (10-shot)	25.4
MMLU (5-shot)	23.12
TruthfulQA (0-shot)	51.15
Winogrande (5-shot)	52.01
GSM8K (5-shot)	0.0
DROP (3-shot)	0.0