Spaces:

mii-llm
/

open_ita_llm_leaderboard

Restarting on CPU Upgrade

App Files Files Community

FinancialSupport commited on May 14

Commit

8f8bf04

•

1 Parent(s): 168eacf

Update src/about.py

Browse files

Files changed (1) hide show

src/about.py +17 -3

src/about.py CHANGED Viewed

@@ -22,18 +22,30 @@ NUM_FEWSHOT = 0 # Change with your few shot
 # Your leaderboard name
-TITLE = """<h1 align="center" id="space-title">Classifica generale degli LLM italiani</h1>"""
 # What does your leaderboard evaluate?
 INTRODUCTION_TEXT = """
 Benvenuti nella pagina della open ita llm leaderboard!
-In questa dashboard potrete trovare tutti i risultati delle performance dei Large Language Models nella lingua italiana sui principali eval
-La classifica è 100% open source, chiunque può contribuire e aggiungere il proprio modello :)
 """
 # Which evaluations are you running? how can people reproduce what you have?
 LLM_BENCHMARKS_TEXT = f"""
 ## Come funziona
 ## Reproducibility
 Per riprodurre i risultati scaricate la [repo](https://github.com/EleutherAI/lm-evaluation-harness) eseguite:
@@ -73,4 +85,6 @@ If everything is done, check you can launch the EleutherAIHarness on your model
 CITATION_BUTTON_LABEL = "Copy the following snippet to cite these results"
 CITATION_BUTTON_TEXT = r"""
 """

 # Your leaderboard name
+TITLE = """<h1 align="center" id="space-title">🚀 Classifica generale degli LLM italiani 🚀</h1>"""
 # What does your leaderboard evaluate?
 INTRODUCTION_TEXT = """
 Benvenuti nella pagina della open ita llm leaderboard!
+In questa dashboard potrete trovare tutti i risultati delle performance dei Large Language Models nella lingua italiana sui principali eval effettuati grazie al fantastico [Eleuther AI Language Model Evaluation Harness](https://github.com/EleutherAI/lm-evaluation-harness).
+Maggiori info nella sezione "about"
+P.s. la classifica è 100% open source, chiunque può contribuire e aggiungere il proprio modello tramite questo [form](https://forms.gle/Gc9Dfu52xSBhQPpAA) nel mentre che la submission automatica sarà operativa :)
+Se avete idee/miglioramenti/suggerimenti [scrivetemi pure] (https://www.linkedin.com/in/samuele-colombo-ml/) oppure mi trovate sul [discord della community] (https://discord.gg/kc97Zwc4ze)
 """
 # Which evaluations are you running? how can people reproduce what you have?
 LLM_BENCHMARKS_TEXT = f"""
 ## Come funziona
+Valutiamo i modelli tramite <a href="https://github.com/EleutherAI/lm-evaluation-harness" target="_blank">  Eleuther AI Language Model Evaluation Harness </a>, il framework più utilizzato dalla community internazionale per l'evaluation dei modelli
+Nella classifica troverete i dataset di benchmark più famosi, adatti alla lingua italiana. I task sono:
+- hellaswag_it
+- arc_it
+- m_mmlu_it (5 shots)
+Per tutti questi task, a un punteggio migliore corrisponde una performance maggiore
 ## Reproducibility
 Per riprodurre i risultati scaricate la [repo](https://github.com/EleutherAI/lm-evaluation-harness) eseguite:
 CITATION_BUTTON_LABEL = "Copy the following snippet to cite these results"
 CITATION_BUTTON_TEXT = r"""
+Paper coming soon!
+Pls dateci credits se usate i nostri benchmarks :)
 """