open_pt_llm_leaderboard

Running on CPU Upgrade

App Files Files Community

eduagarcia commited on Apr 21

Commit

b4fc70b

•

1 Parent(s): 4c822de

fix typo and multiple models in README

Browse files

Files changed (5) hide show

README.md +135 -163
model_list.txt +135 -163
src/display/formatting.py +1 -1
src/leaderboard/read_evals.py +2 -8
update_models_in_readme.py +10 -6

README.md CHANGED Viewed

@@ -27,58 +27,141 @@ space_ci: # See https://huggingface.co/spaces/Wauplin/gradio-space-ci
     - IS_PUBLIC
     - HAS_HIGHER_RATE_LIMIT
 models:
-  - gpt2
-  - t5-base
-  - t5-large
-  - t5-small
   - 01-ai/Yi-34B-200K
   - 01-ai/Yi-34B-Chat
-  - 01-ai/Yi-34B
   - 01-ai/Yi-6B-200K
   - 01-ai/Yi-6B-Chat
-  - 01-ai/Yi-6B
-  - 01-ai/Yi-9B-200k
   - 01-ai/Yi-9B
   - 22h/cabrita_7b_pt_850000
   - 22h/open-cabrita3b
-  - abacusai/Smaug-34B-v0.1
-  - abacusai/Smaug-72B-v0.1
-  - AetherResearch/Cerebrum-1.0-7b
   - AI-Sweden-Models/gpt-sw3-40b
-  - AI-Sweden-Models/gpt-sw3-6.7b-v2
   - AI-Sweden-Models/gpt-sw3-6.7b
   - allenai/OLMo-1B
-  - allenai/OLMo-7B-Twin-2T
   - allenai/OLMo-7B
   - allenai/tulu-2-dpo-13b
   - allenai/tulu-2-dpo-7b
   - argilla/CapybaraHermes-2.5-Mistral-7B
   - argilla/notus-7b-v1
   - argilla/notux-8x7b-v1
-  - BAAI/Aquila-7B
-  - BAAI/Aquila2-34B
-  - BAAI/Aquila2-7B
   - baichuan-inc/Baichuan-7B
   - baichuan-inc/Baichuan2-13B-Base
   - baichuan-inc/Baichuan2-7B-Base
   - bardsai/jaskier-7b-dpo-v5.6
-  - bardsai/jaskier-7b-dpo-v5.6
   - berkeley-nest/Starling-LM-7B-alpha
   - bigscience/bloom-1b7
   - bigscience/bloom-3b
   - bigscience/bloom-560m
   - bigscience/bloom-7b1
-  - Bruno/Caramelinho
-  - Bruno/Caramelo_7B
-  - cnmoro/Mistral-7B-Portuguese
   - cnmoro/Mistral-7B-Portuguese
-  - CohereForAI/aya-101
-  - CohereForAI/c4ai-command-r-plus-4bit
-  - CohereForAI/c4ai-command-r-v01
   - croissantllm/CroissantLLMBase
-  - DAMO-NLP-MT/polylm-1.7b
-  - DAMO-NLP-MT/polylm-13b
-  - Deci/DeciLM-7B
   - deepseek-ai/deepseek-llm-7b-base
   - deepseek-ai/deepseek-moe-16b-base
   - deepseek-ai/deepseek-moe-16b-chat
@@ -88,20 +171,6 @@ models:
   - dynamofl/dynamo-8B-v0.1
   - eduagarcia/gemma-7b-it_no_chat_template
   - eduagarcia/gemma-7b-it_singleturn_chat_template
-  - EleutherAI/gpt-j-6b
-  - EleutherAI/gpt-neo-1.3B
-  - EleutherAI/gpt-neo-125m
-  - EleutherAI/gpt-neo-2.7B
-  - EleutherAI/gpt-neox-20b
-  - EleutherAI/pythia-14m
-  - EleutherAI/pythia-160m-deduped
-  - EleutherAI/pythia-1b-deduped
-  - EleutherAI/pythia-1b
-  - EleutherAI/pythia-2.8b-deduped
-  - EleutherAI/pythia-410m-deduped
-  - EleutherAI/pythia-6.9b-deduped
-  - EleutherAI/pythia-6.9b
-  - EleutherAI/pythia-70m-deduped
   - facebook/opt-1.3b
   - facebook/opt-125m
   - facebook/opt-13b
@@ -110,37 +179,25 @@ models:
   - facebook/opt-350m
   - facebook/opt-6.7b
   - facebook/opt-66b
-  - fernandosola/bluearara-7B-instruct
-  - fernandosola/bluearara-7B
   - fernandosola/bluearara-7B
-  - FuseAI/FuseChat-7B-VaRM
-  - FuseAI/OpenChat-3.5-7B-Solar
   - google/gemma-1.1-2b-it
   - google/gemma-1.1-7b-it
-  - google/gemma-2b-it
   - google/gemma-2b
-  - google/gemma-7b-it
-  - google/gemma-7b-it
   - google/gemma-7b
   - google/mt5-base
-  - google/mt5-base
-  - google/mt5-small
   - google/mt5-small
   - h2oai/h2o-danube-1.8b-base
   - h2oai/h2o-danube-1.8b-chat
   - h2oai/h2o-danube2-1.8b-base
   - h2oai/h2o-danube2-1.8b-chat
-  - HeyLucasLeao/gpt-neo-small-portuguese
-  - HuggingFaceH4/zephyr-7b-alpha
-  - HuggingFaceH4/zephyr-7b-beta
-  - HuggingFaceH4/zephyr-7b-gemma-v0.1
-  - HuggingFaceTB/cosmo-1b
   - huggyllama/llama-13b
   - huggyllama/llama-30b
   - huggyllama/llama-65b
   - huggyllama/llama-7b
-  - Intel/neural-chat-7b-v3-1
-  - Intel/neural-chat-7b-v3-3
   - internlm/internlm-20b
   - internlm/internlm-7b
   - internlm/internlm2-1_8b
@@ -149,18 +206,8 @@ models:
   - internlm/internlm2-base-20b
   - internlm/internlm2-base-7b
   - internlm/internlm2-chat-1_8b
-  - internlm/internlm2-chat-1_8b
   - internlm/internlm2-chat-20b
-  - internlm/internlm2-chat-20b
-  - internlm/internlm2-chat-7b
   - internlm/internlm2-chat-7b
-  - J-LAB/BRisa-7B-Instruct-v0.2
-  - J-LAB/BRisa-7B-Instruct-v0.2
-  - JJhooww/Mistral-7B-v0.2-Base_ptbr
-  - JJhooww/Mistral-7B-v0.2-Base_ptbr
-  - JJhooww/MistralReloadBR_v2_ptbr
-  - JJhooww/Mistral_Relora_Step2k
-  - JJhooww/Mistral_Relora_Step2k
   - josu/gpt-neo-pt-1.3B
   - josu/gpt-neo-pt-br
   - lmsys/vicuna-13b-v1.5
@@ -168,21 +215,18 @@ models:
   - lrds-code/boana-7b-instruct
   - lrds-code/samba-1.1B
   - lucianosb/boto-7B
-  - MagusCorp/legislinho
-  - maritaca-ai/sabia-7b
   - maritaca-ai/sabia-7b
   - matsuo-lab/weblab-10b
-  - MaziyarPanahi/Mistral-7B-Instruct-Aya-101
   - meta-llama/Llama-2-13b-chat-hf
   - meta-llama/Llama-2-13b-hf
   - meta-llama/Llama-2-70b-chat-hf
   - meta-llama/Llama-2-70b-hf
   - meta-llama/Llama-2-7b-chat-hf
   - meta-llama/Llama-2-7b-hf
-  - meta-llama/Meta-Llama-3-8B-Instruct
   - meta-llama/Meta-Llama-3-8B
-  - microsoft/phi-1_5
   - microsoft/phi-1
   - microsoft/phi-2
   - mistral-community/Mistral-7B-v0.2
   - mistral-community/Mixtral-8x22B-v0.1-4bit
@@ -192,159 +236,87 @@ models:
   - mistralai/Mixtral-8x7B-v0.1
   - mlabonne/Monarch-7B
   - monilouise/opt125M_portuguese
-  - mosaicml/mpt-7b-8k
   - mosaicml/mpt-7b
-  - Nexusflow/Starling-LM-7B-beta
   - nicholasKluge/Aira-2-portuguese-124M
   - nicholasKluge/Aira-2-portuguese-1B7
   - nicholasKluge/Aira-2-portuguese-560M
   - nicholasKluge/TeenyTinyLlama-160m
-  - nicholasKluge/TeenyTinyLlama-460m-Chat
   - nicholasKluge/TeenyTinyLlama-460m
-  - nicolasdec/cabra13b
   - nicolasdec/CabraMistral7b-0.4
-  - nicolasdec/Cabramistral7b
-  - nicolasdec/Cabramistral7b
-  - nicolasdec/CabraQwen14b
   - nicolasdec/CabraQwen14b
   - nicolasdec/CabraQwen7b
-  - nicolasdec/Cabra
-  - NousResearch/Nous-Hermes-13b
-  - NousResearch/Nous-Hermes-2-Mistral-7B-DPO
-  - NousResearch/Nous-Hermes-2-Mixtral-8x7B-DPO
-  - NousResearch/Nous-Hermes-2-Mixtral-8x7B-DPO
-  - NousResearch/Nous-Hermes-2-SOLAR-10.7B
-  - NousResearch/Nous-Hermes-2-Yi-34B
-  - NOVA-vision-language/GlorIA-1.3B
-  - NucleusAI/nucleus-22B-token-500B
   - openai-community/gpt2-large
   - openai-community/gpt2-medium
   - openai-community/gpt2-xl
   - openai-community/openai-gpt
   - openchat/openchat-3.5-0106
-  - OpenLLM-France/Claire-7B-0.1
-  - OpenLLM-France/Claire-Mistral-7B-0.1
   - openlm-research/open_llama_13b
   - openlm-research/open_llama_3b
   - openlm-research/open_llama_3b_v2
   - openlm-research/open_llama_7b
   - openlm-research/open_llama_7b_v2
-  - OrionStarAI/Orion-14B-Base
   - paulml/OGNO-7B
   - pierreguillou/gpt2-small-portuguese
-  - PORTULAN/gervasio-7b-portuguese-ptbr-decoder
-  - PORTULAN/gervasio-7b-portuguese-ptpt-decoder
-  - projecte-aina/aguila-7b
   - projecte-aina/FLOR-1.3B
   - projecte-aina/FLOR-6.3B
   - projecte-aina/FLOR-760M
   - pucpr/gpt2-bio-pt
-  - Qwen/Qwen-14B
-  - Qwen/Qwen-14B
-  - Qwen/Qwen-1_8B-Chat
-  - Qwen/Qwen-1_8B-Chat
-  - Qwen/Qwen-1_8B
-  - Qwen/Qwen-1_8B
-  - Qwen/Qwen-72B-Chat
-  - Qwen/Qwen-72B
-  - Qwen/Qwen-7B-Chat
-  - Qwen/Qwen-7B-Chat
-  - Qwen/Qwen-7B
-  - Qwen/Qwen-7B
-  - Qwen/Qwen1.5-0.5B-Chat
-  - Qwen/Qwen1.5-0.5B
-  - Qwen/Qwen1.5-1.8B-Chat
-  - Qwen/Qwen1.5-1.8B
-  - Qwen/Qwen1.5-14B-Chat
-  - Qwen/Qwen1.5-14B
-  - Qwen/Qwen1.5-32B-Chat
-  - Qwen/Qwen1.5-32B
-  - Qwen/Qwen1.5-4B-Chat
-  - Qwen/Qwen1.5-4B
-  - Qwen/Qwen1.5-72B-Chat
-  - Qwen/Qwen1.5-72B
-  - Qwen/Qwen1.5-7B-Chat
-  - Qwen/Qwen1.5-7B
-  - Qwen/Qwen1.5-MoE-A2.7B-Chat
-  - Qwen/Qwen1.5-MoE-A2.7B
   - recogna-nlp/bode-13b-alpaca-pt-br
   - recogna-nlp/bode-7b-alpaca-pt-br
-  - recogna-nlp/GemBode-2b-it
   - recogna-nlp/gembode-2b-ultraalpaca
   - recogna-nlp/internlmbode-7b
   - recogna-nlp/mistral-bode
   - recogna-nlp/phi-bode-2-ultraalpaca
-  - recogna-nlp/Phi-Bode
-  - rhaymison/gemma-portuguese-2b-it
-  - rhaymison/gemma-portuguese-luana-2b
-  - rhaymison/gemma-portuguese-luana-2b
   - rhaymison/Llama-portuguese-13b-Luana-v0.2
-  - rhaymison/Mistral-portuguese-luana-7b-chat
-  - rhaymison/Mistral-portuguese-luana-7b-Mathematics
   - rhaymison/Mistral-portuguese-luana-7b-Mathematics
   - rhaymison/Mistral-portuguese-luana-7b-mental-health
-  - rhaymison/Mistral-portuguese-luana-7b-mental-health
-  - rhaymison/Mistral-portuguese-luana-7b
-  - rhaymison/Qwen-portuguese-luana-7b
   - rhaymison/Qwen-portuguese-luana-7b
-  - rishiraj/CatPPT-base
   - rishiraj/CatPPT
   - semantixai/LloroV2
-  - Skywork/Skywork-13B-base
-  - stabilityai/stablelm-2-12b-chat
   - stabilityai/stablelm-2-12b
-  - stabilityai/stablelm-2-1_6b-chat
-  - stabilityai/stablelm-2-1_6b
   - stabilityai/stablelm-2-1_6b
   - stabilityai/stablelm-2-zephyr-1_6b
   - stabilityai/stablelm-3b-4e1t
-  - stabilityai/stablelm-base-alpha-3b-v2
   - stabilityai/stablelm-base-alpha-3b
-  - stabilityai/stablelm-base-alpha-7b-v2
   - stabilityai/stablelm-base-alpha-7b
   - stabilityai/stablelm-zephyr-3b
   - state-spaces/mamba-1.4b-hf
   - state-spaces/mamba-130m-hf
   - state-spaces/mamba-2.8b-hf
   - state-spaces/mamba-370m-hf
   - state-spaces/mamba-790m-hf
   - teknium/OpenHermes-2-Mistral-7B
   - teknium/OpenHermes-2.5-Mistral-7B
-  - TencentARC/Mistral_Pro_8B_v0.1
-  - THUDM/agentlm-7b
-  - THUDM/chatglm2-6b
-  - THUDM/chatglm3-6b-128k
-  - THUDM/chatglm3-6b-32k
-  - THUDM/chatglm3-6b-base
-  - THUDM/chatglm3-6b
-  - THUDM/LongAlign-7B-64k
   - tiiuae/falcon-40b
   - tiiuae/falcon-7b
-  - TinyLlama/TinyLlama-1.1B-Chat-v1.0
-  - TinyLlama/TinyLlama-1.1B-intermediate-step-1431k-3T
   - togethercomputer/RedPajama-INCITE-7B-Base
   - togethercomputer/RedPajama-INCITE-Base-3B-v1
-  - Unbabel/TowerBase-7B-v0.1
   - upstage/SOLAR-10.7B-Instruct-v1.0
   - upstage/SOLAR-10.7B-v1.0
-  - Walmart-the-bag/Misted-v2-7B
-  - Walmart-the-bag/WordWoven-2x7B
   - wandgibaut/periquito-3B
-  - Weni/WeniGPT-2.2.3-Zephyr-7B-LLM_Base_2.0.3_SFT
-  - Weni/WeniGPT-2.2.3-Zephyr-7B-merged-LLM_Base_2.0.3_SFT
-  - Weni/WeniGPT-2.4.1-Zephyr-7B-3-epochs-GPT-QA-1.0.1_DP_DPO
-  - Weni/WeniGPT-2.8.1-Zephyr-7B-zephyr-prompt-binarized
-  - Weni/WeniGPT-2.8.1-Zephyr-7B-zephyr-prompt-binarized
-  - Weni/WeniGPT-Agents-Zephyr-1.0.17-KTO
-  - Weni/WeniGPT-Mistral-7B-instructBase-4bit
-  - Weni/WeniGPT-Mistral-7B-instructBase
-  - Weni/ZeroShot-3.3.34-Mistral-7b-Multilanguage-3.3.0-merged
-  - Weni/ZeroShot-3.4.22-Mistral-7b-DPO-1.0.0
-  - Weni/ZeroShot-Multilanguage-Zephyr-7B
-  - Weni/ZeroShot-Multilanguage-Zephyr-7B
   - xverse/XVERSE-13B
-  - xverse/XVERSE-65B-2
   - xverse/XVERSE-65B
   - xverse/XVERSE-7B
 ---

     - IS_PUBLIC
     - HAS_HIGHER_RATE_LIMIT
 models:
+  - 01-ai/Yi-34B
   - 01-ai/Yi-34B-200K
   - 01-ai/Yi-34B-Chat
+  - 01-ai/Yi-6B
   - 01-ai/Yi-6B-200K
   - 01-ai/Yi-6B-Chat
   - 01-ai/Yi-9B
+  - 01-ai/Yi-9B-200k
   - 22h/cabrita_7b_pt_850000
   - 22h/open-cabrita3b
   - AI-Sweden-Models/gpt-sw3-40b
   - AI-Sweden-Models/gpt-sw3-6.7b
+  - AI-Sweden-Models/gpt-sw3-6.7b-v2
+  - AetherResearch/Cerebrum-1.0-7b
+  - BAAI/Aquila-7B
+  - BAAI/Aquila2-34B
+  - BAAI/Aquila2-7B
+  - Bruno/Caramelinho
+  - Bruno/Caramelo_7B
+  - CohereForAI/aya-101
+  - CohereForAI/c4ai-command-r-plus-4bit
+  - CohereForAI/c4ai-command-r-v01
+  - DAMO-NLP-MT/polylm-1.7b
+  - DAMO-NLP-MT/polylm-13b
+  - Deci/DeciLM-7B
+  - EleutherAI/gpt-j-6b
+  - EleutherAI/gpt-neo-1.3B
+  - EleutherAI/gpt-neo-125m
+  - EleutherAI/gpt-neo-2.7B
+  - EleutherAI/gpt-neox-20b
+  - EleutherAI/pythia-14m
+  - EleutherAI/pythia-160m-deduped
+  - EleutherAI/pythia-1b
+  - EleutherAI/pythia-1b-deduped
+  - EleutherAI/pythia-2.8b-deduped
+  - EleutherAI/pythia-410m-deduped
+  - EleutherAI/pythia-6.9b
+  - EleutherAI/pythia-6.9b-deduped
+  - EleutherAI/pythia-70m-deduped
+  - FuseAI/FuseChat-7B-VaRM
+  - FuseAI/OpenChat-3.5-7B-Solar
+  - HeyLucasLeao/gpt-neo-small-portuguese
+  - HuggingFaceH4/zephyr-7b-alpha
+  - HuggingFaceH4/zephyr-7b-beta
+  - HuggingFaceH4/zephyr-7b-gemma-v0.1
+  - HuggingFaceTB/cosmo-1b
+  - Intel/neural-chat-7b-v3-1
+  - Intel/neural-chat-7b-v3-3
+  - J-LAB/BRisa-7B-Instruct-v0.2
+  - JJhooww/Mistral-7B-v0.2-Base_ptbr
+  - JJhooww/MistralReloadBR_v2_ptbr
+  - JJhooww/Mistral_Relora_Step2k
+  - MagusCorp/legislinho
+  - MaziyarPanahi/Mistral-7B-Instruct-Aya-101
+  - NOVA-vision-language/GlorIA-1.3B
+  - Nexusflow/Starling-LM-7B-beta
+  - NousResearch/Nous-Hermes-13b
+  - NousResearch/Nous-Hermes-2-Mistral-7B-DPO
+  - NousResearch/Nous-Hermes-2-Mixtral-8x7B-DPO
+  - NousResearch/Nous-Hermes-2-SOLAR-10.7B
+  - NousResearch/Nous-Hermes-2-Yi-34B
+  - NucleusAI/nucleus-22B-token-500B
+  - OpenLLM-France/Claire-7B-0.1
+  - OpenLLM-France/Claire-Mistral-7B-0.1
+  - OrionStarAI/Orion-14B-Base
+  - PORTULAN/gervasio-7b-portuguese-ptbr-decoder
+  - PORTULAN/gervasio-7b-portuguese-ptpt-decoder
+  - Qwen/Qwen-14B
+  - Qwen/Qwen-1_8B
+  - Qwen/Qwen-1_8B-Chat
+  - Qwen/Qwen-72B
+  - Qwen/Qwen-72B-Chat
+  - Qwen/Qwen-7B
+  - Qwen/Qwen-7B-Chat
+  - Qwen/Qwen1.5-0.5B
+  - Qwen/Qwen1.5-0.5B-Chat
+  - Qwen/Qwen1.5-1.8B
+  - Qwen/Qwen1.5-1.8B-Chat
+  - Qwen/Qwen1.5-14B
+  - Qwen/Qwen1.5-14B-Chat
+  - Qwen/Qwen1.5-32B
+  - Qwen/Qwen1.5-32B-Chat
+  - Qwen/Qwen1.5-4B
+  - Qwen/Qwen1.5-4B-Chat
+  - Qwen/Qwen1.5-72B
+  - Qwen/Qwen1.5-72B-Chat
+  - Qwen/Qwen1.5-7B
+  - Qwen/Qwen1.5-7B-Chat
+  - Qwen/Qwen1.5-MoE-A2.7B
+  - Qwen/Qwen1.5-MoE-A2.7B-Chat
+  - Skywork/Skywork-13B-base
+  - THUDM/LongAlign-7B-64k
+  - THUDM/agentlm-7b
+  - THUDM/chatglm2-6b
+  - THUDM/chatglm3-6b
+  - THUDM/chatglm3-6b-128k
+  - THUDM/chatglm3-6b-32k
+  - THUDM/chatglm3-6b-base
+  - TencentARC/Mistral_Pro_8B_v0.1
+  - TinyLlama/TinyLlama-1.1B-Chat-v1.0
+  - TinyLlama/TinyLlama-1.1B-intermediate-step-1431k-3T
+  - Unbabel/TowerBase-7B-v0.1
+  - Walmart-the-bag/Misted-v2-7B
+  - Walmart-the-bag/WordWoven-2x7B
+  - Weni/WeniGPT-2.2.3-Zephyr-7B-LLM_Base_2.0.3_SFT
+  - Weni/WeniGPT-2.2.3-Zephyr-7B-merged-LLM_Base_2.0.3_SFT
+  - Weni/WeniGPT-2.4.1-Zephyr-7B-3-epochs-GPT-QA-1.0.1_DP_DPO
+  - Weni/WeniGPT-2.8.1-Zephyr-7B-zephyr-prompt-binarized
+  - Weni/WeniGPT-Agents-Zephyr-1.0.17-KTO
+  - Weni/WeniGPT-Mistral-7B-instructBase
+  - Weni/WeniGPT-Mistral-7B-instructBase-4bit
+  - Weni/ZeroShot-3.3.34-Mistral-7b-Multilanguage-3.3.0-merged
+  - Weni/ZeroShot-3.4.22-Mistral-7b-DPO-1.0.0
+  - Weni/ZeroShot-Multilanguage-Zephyr-7B
+  - abacusai/Smaug-34B-v0.1
+  - abacusai/Smaug-72B-v0.1
   - allenai/OLMo-1B
   - allenai/OLMo-7B
+  - allenai/OLMo-7B-Twin-2T
   - allenai/tulu-2-dpo-13b
   - allenai/tulu-2-dpo-7b
   - argilla/CapybaraHermes-2.5-Mistral-7B
   - argilla/notus-7b-v1
   - argilla/notux-8x7b-v1
   - baichuan-inc/Baichuan-7B
   - baichuan-inc/Baichuan2-13B-Base
   - baichuan-inc/Baichuan2-7B-Base
   - bardsai/jaskier-7b-dpo-v5.6
   - berkeley-nest/Starling-LM-7B-alpha
   - bigscience/bloom-1b7
   - bigscience/bloom-3b
   - bigscience/bloom-560m
   - bigscience/bloom-7b1
   - cnmoro/Mistral-7B-Portuguese
   - croissantllm/CroissantLLMBase
   - deepseek-ai/deepseek-llm-7b-base
   - deepseek-ai/deepseek-moe-16b-base
   - deepseek-ai/deepseek-moe-16b-chat
   - dynamofl/dynamo-8B-v0.1
   - eduagarcia/gemma-7b-it_no_chat_template
   - eduagarcia/gemma-7b-it_singleturn_chat_template
   - facebook/opt-1.3b
   - facebook/opt-125m
   - facebook/opt-13b
   - facebook/opt-350m
   - facebook/opt-6.7b
   - facebook/opt-66b
   - fernandosola/bluearara-7B
+  - fernandosola/bluearara-7B-instruct
   - google/gemma-1.1-2b-it
   - google/gemma-1.1-7b-it
   - google/gemma-2b
+  - google/gemma-2b-it
   - google/gemma-7b
+  - google/gemma-7b-it
   - google/mt5-base
   - google/mt5-small
+  - gpt2
   - h2oai/h2o-danube-1.8b-base
   - h2oai/h2o-danube-1.8b-chat
   - h2oai/h2o-danube2-1.8b-base
   - h2oai/h2o-danube2-1.8b-chat
   - huggyllama/llama-13b
   - huggyllama/llama-30b
   - huggyllama/llama-65b
   - huggyllama/llama-7b
   - internlm/internlm-20b
   - internlm/internlm-7b
   - internlm/internlm2-1_8b
   - internlm/internlm2-base-20b
   - internlm/internlm2-base-7b
   - internlm/internlm2-chat-1_8b
   - internlm/internlm2-chat-20b
   - internlm/internlm2-chat-7b
   - josu/gpt-neo-pt-1.3B
   - josu/gpt-neo-pt-br
   - lmsys/vicuna-13b-v1.5
   - lrds-code/boana-7b-instruct
   - lrds-code/samba-1.1B
   - lucianosb/boto-7B
   - maritaca-ai/sabia-7b
   - matsuo-lab/weblab-10b
   - meta-llama/Llama-2-13b-chat-hf
   - meta-llama/Llama-2-13b-hf
   - meta-llama/Llama-2-70b-chat-hf
   - meta-llama/Llama-2-70b-hf
   - meta-llama/Llama-2-7b-chat-hf
   - meta-llama/Llama-2-7b-hf
   - meta-llama/Meta-Llama-3-8B
+  - meta-llama/Meta-Llama-3-8B-Instruct
   - microsoft/phi-1
+  - microsoft/phi-1_5
   - microsoft/phi-2
   - mistral-community/Mistral-7B-v0.2
   - mistral-community/Mixtral-8x22B-v0.1-4bit
   - mistralai/Mixtral-8x7B-v0.1
   - mlabonne/Monarch-7B
   - monilouise/opt125M_portuguese
   - mosaicml/mpt-7b
+  - mosaicml/mpt-7b-8k
   - nicholasKluge/Aira-2-portuguese-124M
   - nicholasKluge/Aira-2-portuguese-1B7
   - nicholasKluge/Aira-2-portuguese-560M
   - nicholasKluge/TeenyTinyLlama-160m
   - nicholasKluge/TeenyTinyLlama-460m
+  - nicholasKluge/TeenyTinyLlama-460m-Chat
+  - nicolasdec/Cabra
   - nicolasdec/CabraMistral7b-0.4
   - nicolasdec/CabraQwen14b
   - nicolasdec/CabraQwen7b
+  - nicolasdec/Cabramistral7b
+  - nicolasdec/cabra13b
   - openai-community/gpt2-large
   - openai-community/gpt2-medium
   - openai-community/gpt2-xl
   - openai-community/openai-gpt
   - openchat/openchat-3.5-0106
   - openlm-research/open_llama_13b
   - openlm-research/open_llama_3b
   - openlm-research/open_llama_3b_v2
   - openlm-research/open_llama_7b
   - openlm-research/open_llama_7b_v2
   - paulml/OGNO-7B
   - pierreguillou/gpt2-small-portuguese
   - projecte-aina/FLOR-1.3B
   - projecte-aina/FLOR-6.3B
   - projecte-aina/FLOR-760M
+  - projecte-aina/aguila-7b
   - pucpr/gpt2-bio-pt
+  - recogna-nlp/GemBode-2b-it
+  - recogna-nlp/Phi-Bode
   - recogna-nlp/bode-13b-alpaca-pt-br
   - recogna-nlp/bode-7b-alpaca-pt-br
   - recogna-nlp/gembode-2b-ultraalpaca
   - recogna-nlp/internlmbode-7b
   - recogna-nlp/mistral-bode
   - recogna-nlp/phi-bode-2-ultraalpaca
   - rhaymison/Llama-portuguese-13b-Luana-v0.2
+  - rhaymison/Mistral-portuguese-luana-7b
   - rhaymison/Mistral-portuguese-luana-7b-Mathematics
+  - rhaymison/Mistral-portuguese-luana-7b-chat
   - rhaymison/Mistral-portuguese-luana-7b-mental-health
   - rhaymison/Qwen-portuguese-luana-7b
+  - rhaymison/gemma-portuguese-2b-it
+  - rhaymison/gemma-portuguese-luana-2b
   - rishiraj/CatPPT
+  - rishiraj/CatPPT-base
   - semantixai/LloroV2
   - stabilityai/stablelm-2-12b
+  - stabilityai/stablelm-2-12b-chat
   - stabilityai/stablelm-2-1_6b
+  - stabilityai/stablelm-2-1_6b-chat
   - stabilityai/stablelm-2-zephyr-1_6b
   - stabilityai/stablelm-3b-4e1t
   - stabilityai/stablelm-base-alpha-3b
+  - stabilityai/stablelm-base-alpha-3b-v2
   - stabilityai/stablelm-base-alpha-7b
+  - stabilityai/stablelm-base-alpha-7b-v2
   - stabilityai/stablelm-zephyr-3b
   - state-spaces/mamba-1.4b-hf
   - state-spaces/mamba-130m-hf
   - state-spaces/mamba-2.8b-hf
   - state-spaces/mamba-370m-hf
   - state-spaces/mamba-790m-hf
+  - t5-base
+  - t5-large
+  - t5-small
   - teknium/OpenHermes-2-Mistral-7B
   - teknium/OpenHermes-2.5-Mistral-7B
   - tiiuae/falcon-40b
   - tiiuae/falcon-7b
   - togethercomputer/RedPajama-INCITE-7B-Base
   - togethercomputer/RedPajama-INCITE-Base-3B-v1
   - upstage/SOLAR-10.7B-Instruct-v1.0
   - upstage/SOLAR-10.7B-v1.0
   - wandgibaut/periquito-3B
   - xverse/XVERSE-13B
   - xverse/XVERSE-65B
+  - xverse/XVERSE-65B-2
   - xverse/XVERSE-7B
 ---

model_list.txt CHANGED Viewed

@@ -1,55 +1,138 @@
-  - gpt2
-  - t5-base
-  - t5-large
-  - t5-small
   - 01-ai/Yi-34B-200K
   - 01-ai/Yi-34B-Chat
-  - 01-ai/Yi-34B
   - 01-ai/Yi-6B-200K
   - 01-ai/Yi-6B-Chat
-  - 01-ai/Yi-6B
-  - 01-ai/Yi-9B-200k
   - 01-ai/Yi-9B
   - 22h/cabrita_7b_pt_850000
   - 22h/open-cabrita3b
-  - abacusai/Smaug-34B-v0.1
-  - abacusai/Smaug-72B-v0.1
-  - AetherResearch/Cerebrum-1.0-7b
   - AI-Sweden-Models/gpt-sw3-40b
-  - AI-Sweden-Models/gpt-sw3-6.7b-v2
   - AI-Sweden-Models/gpt-sw3-6.7b
   - allenai/OLMo-1B
-  - allenai/OLMo-7B-Twin-2T
   - allenai/OLMo-7B
   - allenai/tulu-2-dpo-13b
   - allenai/tulu-2-dpo-7b
   - argilla/CapybaraHermes-2.5-Mistral-7B
   - argilla/notus-7b-v1
   - argilla/notux-8x7b-v1
-  - BAAI/Aquila-7B
-  - BAAI/Aquila2-34B
-  - BAAI/Aquila2-7B
   - baichuan-inc/Baichuan-7B
   - baichuan-inc/Baichuan2-13B-Base
   - baichuan-inc/Baichuan2-7B-Base
   - bardsai/jaskier-7b-dpo-v5.6
-  - bardsai/jaskier-7b-dpo-v5.6
   - berkeley-nest/Starling-LM-7B-alpha
   - bigscience/bloom-1b7
   - bigscience/bloom-3b
   - bigscience/bloom-560m
   - bigscience/bloom-7b1
-  - Bruno/Caramelinho
-  - Bruno/Caramelo_7B
-  - cnmoro/Mistral-7B-Portuguese
   - cnmoro/Mistral-7B-Portuguese
-  - CohereForAI/aya-101
-  - CohereForAI/c4ai-command-r-plus-4bit
-  - CohereForAI/c4ai-command-r-v01
   - croissantllm/CroissantLLMBase
-  - DAMO-NLP-MT/polylm-1.7b
-  - DAMO-NLP-MT/polylm-13b
-  - Deci/DeciLM-7B
   - deepseek-ai/deepseek-llm-7b-base
   - deepseek-ai/deepseek-moe-16b-base
   - deepseek-ai/deepseek-moe-16b-chat
@@ -59,20 +142,6 @@
   - dynamofl/dynamo-8B-v0.1
   - eduagarcia/gemma-7b-it_no_chat_template
   - eduagarcia/gemma-7b-it_singleturn_chat_template
-  - EleutherAI/gpt-j-6b
-  - EleutherAI/gpt-neo-1.3B
-  - EleutherAI/gpt-neo-125m
-  - EleutherAI/gpt-neo-2.7B
-  - EleutherAI/gpt-neox-20b
-  - EleutherAI/pythia-14m
-  - EleutherAI/pythia-160m-deduped
-  - EleutherAI/pythia-1b-deduped
-  - EleutherAI/pythia-1b
-  - EleutherAI/pythia-2.8b-deduped
-  - EleutherAI/pythia-410m-deduped
-  - EleutherAI/pythia-6.9b-deduped
-  - EleutherAI/pythia-6.9b
-  - EleutherAI/pythia-70m-deduped
   - facebook/opt-1.3b
   - facebook/opt-125m
   - facebook/opt-13b
@@ -81,37 +150,25 @@
   - facebook/opt-350m
   - facebook/opt-6.7b
   - facebook/opt-66b
-  - fernandosola/bluearara-7B-instruct
-  - fernandosola/bluearara-7B
   - fernandosola/bluearara-7B
-  - FuseAI/FuseChat-7B-VaRM
-  - FuseAI/OpenChat-3.5-7B-Solar
   - google/gemma-1.1-2b-it
   - google/gemma-1.1-7b-it
-  - google/gemma-2b-it
   - google/gemma-2b
-  - google/gemma-7b-it
-  - google/gemma-7b-it
   - google/gemma-7b
   - google/mt5-base
-  - google/mt5-base
-  - google/mt5-small
   - google/mt5-small
   - h2oai/h2o-danube-1.8b-base
   - h2oai/h2o-danube-1.8b-chat
   - h2oai/h2o-danube2-1.8b-base
   - h2oai/h2o-danube2-1.8b-chat
-  - HeyLucasLeao/gpt-neo-small-portuguese
-  - HuggingFaceH4/zephyr-7b-alpha
-  - HuggingFaceH4/zephyr-7b-beta
-  - HuggingFaceH4/zephyr-7b-gemma-v0.1
-  - HuggingFaceTB/cosmo-1b
   - huggyllama/llama-13b
   - huggyllama/llama-30b
   - huggyllama/llama-65b
   - huggyllama/llama-7b
-  - Intel/neural-chat-7b-v3-1
-  - Intel/neural-chat-7b-v3-3
   - internlm/internlm-20b
   - internlm/internlm-7b
   - internlm/internlm2-1_8b
@@ -120,18 +177,8 @@
   - internlm/internlm2-base-20b
   - internlm/internlm2-base-7b
   - internlm/internlm2-chat-1_8b
-  - internlm/internlm2-chat-1_8b
   - internlm/internlm2-chat-20b
-  - internlm/internlm2-chat-20b
-  - internlm/internlm2-chat-7b
   - internlm/internlm2-chat-7b
-  - J-LAB/BRisa-7B-Instruct-v0.2
-  - J-LAB/BRisa-7B-Instruct-v0.2
-  - JJhooww/Mistral-7B-v0.2-Base_ptbr
-  - JJhooww/Mistral-7B-v0.2-Base_ptbr
-  - JJhooww/MistralReloadBR_v2_ptbr
-  - JJhooww/Mistral_Relora_Step2k
-  - JJhooww/Mistral_Relora_Step2k
   - josu/gpt-neo-pt-1.3B
   - josu/gpt-neo-pt-br
   - lmsys/vicuna-13b-v1.5
@@ -139,21 +186,18 @@
   - lrds-code/boana-7b-instruct
   - lrds-code/samba-1.1B
   - lucianosb/boto-7B
-  - MagusCorp/legislinho
-  - maritaca-ai/sabia-7b
   - maritaca-ai/sabia-7b
   - matsuo-lab/weblab-10b
-  - MaziyarPanahi/Mistral-7B-Instruct-Aya-101
   - meta-llama/Llama-2-13b-chat-hf
   - meta-llama/Llama-2-13b-hf
   - meta-llama/Llama-2-70b-chat-hf
   - meta-llama/Llama-2-70b-hf
   - meta-llama/Llama-2-7b-chat-hf
   - meta-llama/Llama-2-7b-hf
-  - meta-llama/Meta-Llama-3-8B-Instruct
   - meta-llama/Meta-Llama-3-8B
-  - microsoft/phi-1_5
   - microsoft/phi-1
   - microsoft/phi-2
   - mistral-community/Mistral-7B-v0.2
   - mistral-community/Mixtral-8x22B-v0.1-4bit
@@ -163,157 +207,85 @@
   - mistralai/Mixtral-8x7B-v0.1
   - mlabonne/Monarch-7B
   - monilouise/opt125M_portuguese
-  - mosaicml/mpt-7b-8k
   - mosaicml/mpt-7b
-  - Nexusflow/Starling-LM-7B-beta
   - nicholasKluge/Aira-2-portuguese-124M
   - nicholasKluge/Aira-2-portuguese-1B7
   - nicholasKluge/Aira-2-portuguese-560M
   - nicholasKluge/TeenyTinyLlama-160m
-  - nicholasKluge/TeenyTinyLlama-460m-Chat
   - nicholasKluge/TeenyTinyLlama-460m
-  - nicolasdec/cabra13b
   - nicolasdec/CabraMistral7b-0.4
-  - nicolasdec/Cabramistral7b
-  - nicolasdec/Cabramistral7b
-  - nicolasdec/CabraQwen14b
   - nicolasdec/CabraQwen14b
   - nicolasdec/CabraQwen7b
-  - nicolasdec/Cabra
-  - NousResearch/Nous-Hermes-13b
-  - NousResearch/Nous-Hermes-2-Mistral-7B-DPO
-  - NousResearch/Nous-Hermes-2-Mixtral-8x7B-DPO
-  - NousResearch/Nous-Hermes-2-Mixtral-8x7B-DPO
-  - NousResearch/Nous-Hermes-2-SOLAR-10.7B
-  - NousResearch/Nous-Hermes-2-Yi-34B
-  - NOVA-vision-language/GlorIA-1.3B
-  - NucleusAI/nucleus-22B-token-500B
   - openai-community/gpt2-large
   - openai-community/gpt2-medium
   - openai-community/gpt2-xl
   - openai-community/openai-gpt
   - openchat/openchat-3.5-0106
-  - OpenLLM-France/Claire-7B-0.1
-  - OpenLLM-France/Claire-Mistral-7B-0.1
   - openlm-research/open_llama_13b
   - openlm-research/open_llama_3b
   - openlm-research/open_llama_3b_v2
   - openlm-research/open_llama_7b
   - openlm-research/open_llama_7b_v2
-  - OrionStarAI/Orion-14B-Base
   - paulml/OGNO-7B
   - pierreguillou/gpt2-small-portuguese
-  - PORTULAN/gervasio-7b-portuguese-ptbr-decoder
-  - PORTULAN/gervasio-7b-portuguese-ptpt-decoder
-  - projecte-aina/aguila-7b
   - projecte-aina/FLOR-1.3B
   - projecte-aina/FLOR-6.3B
   - projecte-aina/FLOR-760M
   - pucpr/gpt2-bio-pt
-  - Qwen/Qwen-14B
-  - Qwen/Qwen-14B
-  - Qwen/Qwen-1_8B-Chat
-  - Qwen/Qwen-1_8B-Chat
-  - Qwen/Qwen-1_8B
-  - Qwen/Qwen-1_8B
-  - Qwen/Qwen-72B-Chat
-  - Qwen/Qwen-72B
-  - Qwen/Qwen-7B-Chat
-  - Qwen/Qwen-7B-Chat
-  - Qwen/Qwen-7B
-  - Qwen/Qwen-7B
-  - Qwen/Qwen1.5-0.5B-Chat
-  - Qwen/Qwen1.5-0.5B
-  - Qwen/Qwen1.5-1.8B-Chat
-  - Qwen/Qwen1.5-1.8B
-  - Qwen/Qwen1.5-14B-Chat
-  - Qwen/Qwen1.5-14B
-  - Qwen/Qwen1.5-32B-Chat
-  - Qwen/Qwen1.5-32B
-  - Qwen/Qwen1.5-4B-Chat
-  - Qwen/Qwen1.5-4B
-  - Qwen/Qwen1.5-72B-Chat
-  - Qwen/Qwen1.5-72B
-  - Qwen/Qwen1.5-7B-Chat
-  - Qwen/Qwen1.5-7B
-  - Qwen/Qwen1.5-MoE-A2.7B-Chat
-  - Qwen/Qwen1.5-MoE-A2.7B
   - recogna-nlp/bode-13b-alpaca-pt-br
   - recogna-nlp/bode-7b-alpaca-pt-br
-  - recogna-nlp/GemBode-2b-it
   - recogna-nlp/gembode-2b-ultraalpaca
   - recogna-nlp/internlmbode-7b
   - recogna-nlp/mistral-bode
   - recogna-nlp/phi-bode-2-ultraalpaca
-  - recogna-nlp/Phi-Bode
-  - rhaymison/gemma-portuguese-2b-it
-  - rhaymison/gemma-portuguese-luana-2b
-  - rhaymison/gemma-portuguese-luana-2b
   - rhaymison/Llama-portuguese-13b-Luana-v0.2
-  - rhaymison/Mistral-portuguese-luana-7b-chat
-  - rhaymison/Mistral-portuguese-luana-7b-Mathematics
   - rhaymison/Mistral-portuguese-luana-7b-Mathematics
   - rhaymison/Mistral-portuguese-luana-7b-mental-health
-  - rhaymison/Mistral-portuguese-luana-7b-mental-health
-  - rhaymison/Mistral-portuguese-luana-7b
-  - rhaymison/Qwen-portuguese-luana-7b
   - rhaymison/Qwen-portuguese-luana-7b
-  - rishiraj/CatPPT-base
   - rishiraj/CatPPT
   - semantixai/LloroV2
-  - Skywork/Skywork-13B-base
-  - stabilityai/stablelm-2-12b-chat
   - stabilityai/stablelm-2-12b
-  - stabilityai/stablelm-2-1_6b-chat
-  - stabilityai/stablelm-2-1_6b
   - stabilityai/stablelm-2-1_6b
   - stabilityai/stablelm-2-zephyr-1_6b
   - stabilityai/stablelm-3b-4e1t
-  - stabilityai/stablelm-base-alpha-3b-v2
   - stabilityai/stablelm-base-alpha-3b
-  - stabilityai/stablelm-base-alpha-7b-v2
   - stabilityai/stablelm-base-alpha-7b
   - stabilityai/stablelm-zephyr-3b
   - state-spaces/mamba-1.4b-hf
   - state-spaces/mamba-130m-hf
   - state-spaces/mamba-2.8b-hf
   - state-spaces/mamba-370m-hf
   - state-spaces/mamba-790m-hf
   - teknium/OpenHermes-2-Mistral-7B
   - teknium/OpenHermes-2.5-Mistral-7B
-  - TencentARC/Mistral_Pro_8B_v0.1
-  - THUDM/agentlm-7b
-  - THUDM/chatglm2-6b
-  - THUDM/chatglm3-6b-128k
-  - THUDM/chatglm3-6b-32k
-  - THUDM/chatglm3-6b-base
-  - THUDM/chatglm3-6b
-  - THUDM/LongAlign-7B-64k
   - tiiuae/falcon-40b
   - tiiuae/falcon-7b
-  - TinyLlama/TinyLlama-1.1B-Chat-v1.0
-  - TinyLlama/TinyLlama-1.1B-intermediate-step-1431k-3T
   - togethercomputer/RedPajama-INCITE-7B-Base
   - togethercomputer/RedPajama-INCITE-Base-3B-v1
-  - Unbabel/TowerBase-7B-v0.1
   - upstage/SOLAR-10.7B-Instruct-v1.0
   - upstage/SOLAR-10.7B-v1.0
-  - Walmart-the-bag/Misted-v2-7B
-  - Walmart-the-bag/WordWoven-2x7B
   - wandgibaut/periquito-3B
-  - Weni/WeniGPT-2.2.3-Zephyr-7B-LLM_Base_2.0.3_SFT
-  - Weni/WeniGPT-2.2.3-Zephyr-7B-merged-LLM_Base_2.0.3_SFT
-  - Weni/WeniGPT-2.4.1-Zephyr-7B-3-epochs-GPT-QA-1.0.1_DP_DPO
-  - Weni/WeniGPT-2.8.1-Zephyr-7B-zephyr-prompt-binarized
-  - Weni/WeniGPT-2.8.1-Zephyr-7B-zephyr-prompt-binarized
-  - Weni/WeniGPT-Agents-Zephyr-1.0.17-KTO
-  - Weni/WeniGPT-Mistral-7B-instructBase-4bit
-  - Weni/WeniGPT-Mistral-7B-instructBase
-  - Weni/ZeroShot-3.3.34-Mistral-7b-Multilanguage-3.3.0-merged
-  - Weni/ZeroShot-3.4.22-Mistral-7b-DPO-1.0.0
-  - Weni/ZeroShot-Multilanguage-Zephyr-7B
-  - Weni/ZeroShot-Multilanguage-Zephyr-7B
   - xverse/XVERSE-13B
-  - xverse/XVERSE-65B-2
   - xverse/XVERSE-65B
   - xverse/XVERSE-7B

+  - 01-ai/Yi-34B
   - 01-ai/Yi-34B-200K
   - 01-ai/Yi-34B-Chat
+  - 01-ai/Yi-6B
   - 01-ai/Yi-6B-200K
   - 01-ai/Yi-6B-Chat
   - 01-ai/Yi-9B
+  - 01-ai/Yi-9B-200k
   - 22h/cabrita_7b_pt_850000
   - 22h/open-cabrita3b
   - AI-Sweden-Models/gpt-sw3-40b
   - AI-Sweden-Models/gpt-sw3-6.7b
+  - AI-Sweden-Models/gpt-sw3-6.7b-v2
+  - AetherResearch/Cerebrum-1.0-7b
+  - BAAI/Aquila-7B
+  - BAAI/Aquila2-34B
+  - BAAI/Aquila2-7B
+  - Bruno/Caramelinho
+  - Bruno/Caramelo_7B
+  - CohereForAI/aya-101
+  - CohereForAI/c4ai-command-r-plus-4bit
+  - CohereForAI/c4ai-command-r-v01
+  - DAMO-NLP-MT/polylm-1.7b
+  - DAMO-NLP-MT/polylm-13b
+  - Deci/DeciLM-7B
+  - EleutherAI/gpt-j-6b
+  - EleutherAI/gpt-neo-1.3B
+  - EleutherAI/gpt-neo-125m
+  - EleutherAI/gpt-neo-2.7B
+  - EleutherAI/gpt-neox-20b
+  - EleutherAI/pythia-14m
+  - EleutherAI/pythia-160m-deduped
+  - EleutherAI/pythia-1b
+  - EleutherAI/pythia-1b-deduped
+  - EleutherAI/pythia-2.8b-deduped
+  - EleutherAI/pythia-410m-deduped
+  - EleutherAI/pythia-6.9b
+  - EleutherAI/pythia-6.9b-deduped
+  - EleutherAI/pythia-70m-deduped
+  - FuseAI/FuseChat-7B-VaRM
+  - FuseAI/OpenChat-3.5-7B-Solar
+  - HeyLucasLeao/gpt-neo-small-portuguese
+  - HuggingFaceH4/zephyr-7b-alpha
+  - HuggingFaceH4/zephyr-7b-beta
+  - HuggingFaceH4/zephyr-7b-gemma-v0.1
+  - HuggingFaceTB/cosmo-1b
+  - Intel/neural-chat-7b-v3-1
+  - Intel/neural-chat-7b-v3-3
+  - J-LAB/BRisa-7B-Instruct-v0.2
+  - JJhooww/Mistral-7B-v0.2-Base_ptbr
+  - JJhooww/MistralReloadBR_v2_ptbr
+  - JJhooww/Mistral_Relora_Step2k
+  - MagusCorp/legislinho
+  - MaziyarPanahi/Mistral-7B-Instruct-Aya-101
+  - NOVA-vision-language/GlorIA-1.3B
+  - Nexusflow/Starling-LM-7B-beta
+  - NousResearch/Nous-Hermes-13b
+  - NousResearch/Nous-Hermes-2-Mistral-7B-DPO
+  - NousResearch/Nous-Hermes-2-Mixtral-8x7B-DPO
+  - NousResearch/Nous-Hermes-2-SOLAR-10.7B
+  - NousResearch/Nous-Hermes-2-Yi-34B
+  - NucleusAI/nucleus-22B-token-500B
+  - OpenLLM-France/Claire-7B-0.1
+  - OpenLLM-France/Claire-Mistral-7B-0.1
+  - OrionStarAI/Orion-14B-Base
+  - PORTULAN/gervasio-7b-portuguese-ptbr-decoder
+  - PORTULAN/gervasio-7b-portuguese-ptpt-decoder
+  - Qwen/Qwen-14B
+  - Qwen/Qwen-1_8B
+  - Qwen/Qwen-1_8B-Chat
+  - Qwen/Qwen-72B
+  - Qwen/Qwen-72B-Chat
+  - Qwen/Qwen-7B
+  - Qwen/Qwen-7B-Chat
+  - Qwen/Qwen1.5-0.5B
+  - Qwen/Qwen1.5-0.5B-Chat
+  - Qwen/Qwen1.5-1.8B
+  - Qwen/Qwen1.5-1.8B-Chat
+  - Qwen/Qwen1.5-14B
+  - Qwen/Qwen1.5-14B-Chat
+  - Qwen/Qwen1.5-32B
+  - Qwen/Qwen1.5-32B-Chat
+  - Qwen/Qwen1.5-4B
+  - Qwen/Qwen1.5-4B-Chat
+  - Qwen/Qwen1.5-72B
+  - Qwen/Qwen1.5-72B-Chat
+  - Qwen/Qwen1.5-7B
+  - Qwen/Qwen1.5-7B-Chat
+  - Qwen/Qwen1.5-MoE-A2.7B
+  - Qwen/Qwen1.5-MoE-A2.7B-Chat
+  - Skywork/Skywork-13B-base
+  - THUDM/LongAlign-7B-64k
+  - THUDM/agentlm-7b
+  - THUDM/chatglm2-6b
+  - THUDM/chatglm3-6b
+  - THUDM/chatglm3-6b-128k
+  - THUDM/chatglm3-6b-32k
+  - THUDM/chatglm3-6b-base
+  - TencentARC/Mistral_Pro_8B_v0.1
+  - TinyLlama/TinyLlama-1.1B-Chat-v1.0
+  - TinyLlama/TinyLlama-1.1B-intermediate-step-1431k-3T
+  - Unbabel/TowerBase-7B-v0.1
+  - Walmart-the-bag/Misted-v2-7B
+  - Walmart-the-bag/WordWoven-2x7B
+  - Weni/WeniGPT-2.2.3-Zephyr-7B-LLM_Base_2.0.3_SFT
+  - Weni/WeniGPT-2.2.3-Zephyr-7B-merged-LLM_Base_2.0.3_SFT
+  - Weni/WeniGPT-2.4.1-Zephyr-7B-3-epochs-GPT-QA-1.0.1_DP_DPO
+  - Weni/WeniGPT-2.8.1-Zephyr-7B-zephyr-prompt-binarized
+  - Weni/WeniGPT-Agents-Zephyr-1.0.17-KTO
+  - Weni/WeniGPT-Mistral-7B-instructBase
+  - Weni/WeniGPT-Mistral-7B-instructBase-4bit
+  - Weni/ZeroShot-3.3.34-Mistral-7b-Multilanguage-3.3.0-merged
+  - Weni/ZeroShot-3.4.22-Mistral-7b-DPO-1.0.0
+  - Weni/ZeroShot-Multilanguage-Zephyr-7B
+  - abacusai/Smaug-34B-v0.1
+  - abacusai/Smaug-72B-v0.1
   - allenai/OLMo-1B
   - allenai/OLMo-7B
+  - allenai/OLMo-7B-Twin-2T
   - allenai/tulu-2-dpo-13b
   - allenai/tulu-2-dpo-7b
   - argilla/CapybaraHermes-2.5-Mistral-7B
   - argilla/notus-7b-v1
   - argilla/notux-8x7b-v1
   - baichuan-inc/Baichuan-7B
   - baichuan-inc/Baichuan2-13B-Base
   - baichuan-inc/Baichuan2-7B-Base
   - bardsai/jaskier-7b-dpo-v5.6
   - berkeley-nest/Starling-LM-7B-alpha
   - bigscience/bloom-1b7
   - bigscience/bloom-3b
   - bigscience/bloom-560m
   - bigscience/bloom-7b1
   - cnmoro/Mistral-7B-Portuguese
   - croissantllm/CroissantLLMBase
   - deepseek-ai/deepseek-llm-7b-base
   - deepseek-ai/deepseek-moe-16b-base
   - deepseek-ai/deepseek-moe-16b-chat
   - dynamofl/dynamo-8B-v0.1
   - eduagarcia/gemma-7b-it_no_chat_template
   - eduagarcia/gemma-7b-it_singleturn_chat_template
   - facebook/opt-1.3b
   - facebook/opt-125m
   - facebook/opt-13b
   - facebook/opt-350m
   - facebook/opt-6.7b
   - facebook/opt-66b
   - fernandosola/bluearara-7B
+  - fernandosola/bluearara-7B-instruct
   - google/gemma-1.1-2b-it
   - google/gemma-1.1-7b-it
   - google/gemma-2b
+  - google/gemma-2b-it
   - google/gemma-7b
+  - google/gemma-7b-it
   - google/mt5-base
   - google/mt5-small
+  - gpt2
   - h2oai/h2o-danube-1.8b-base
   - h2oai/h2o-danube-1.8b-chat
   - h2oai/h2o-danube2-1.8b-base
   - h2oai/h2o-danube2-1.8b-chat
   - huggyllama/llama-13b
   - huggyllama/llama-30b
   - huggyllama/llama-65b
   - huggyllama/llama-7b
   - internlm/internlm-20b
   - internlm/internlm-7b
   - internlm/internlm2-1_8b
   - internlm/internlm2-base-20b
   - internlm/internlm2-base-7b
   - internlm/internlm2-chat-1_8b
   - internlm/internlm2-chat-20b
   - internlm/internlm2-chat-7b
   - josu/gpt-neo-pt-1.3B
   - josu/gpt-neo-pt-br
   - lmsys/vicuna-13b-v1.5
   - lrds-code/boana-7b-instruct
   - lrds-code/samba-1.1B
   - lucianosb/boto-7B
   - maritaca-ai/sabia-7b
   - matsuo-lab/weblab-10b
   - meta-llama/Llama-2-13b-chat-hf
   - meta-llama/Llama-2-13b-hf
   - meta-llama/Llama-2-70b-chat-hf
   - meta-llama/Llama-2-70b-hf
   - meta-llama/Llama-2-7b-chat-hf
   - meta-llama/Llama-2-7b-hf
   - meta-llama/Meta-Llama-3-8B
+  - meta-llama/Meta-Llama-3-8B-Instruct
   - microsoft/phi-1
+  - microsoft/phi-1_5
   - microsoft/phi-2
   - mistral-community/Mistral-7B-v0.2
   - mistral-community/Mixtral-8x22B-v0.1-4bit
   - mistralai/Mixtral-8x7B-v0.1
   - mlabonne/Monarch-7B
   - monilouise/opt125M_portuguese
   - mosaicml/mpt-7b
+  - mosaicml/mpt-7b-8k
   - nicholasKluge/Aira-2-portuguese-124M
   - nicholasKluge/Aira-2-portuguese-1B7
   - nicholasKluge/Aira-2-portuguese-560M
   - nicholasKluge/TeenyTinyLlama-160m
   - nicholasKluge/TeenyTinyLlama-460m
+  - nicholasKluge/TeenyTinyLlama-460m-Chat
+  - nicolasdec/Cabra
   - nicolasdec/CabraMistral7b-0.4
   - nicolasdec/CabraQwen14b
   - nicolasdec/CabraQwen7b
+  - nicolasdec/Cabramistral7b
+  - nicolasdec/cabra13b
   - openai-community/gpt2-large
   - openai-community/gpt2-medium
   - openai-community/gpt2-xl
   - openai-community/openai-gpt
   - openchat/openchat-3.5-0106
   - openlm-research/open_llama_13b
   - openlm-research/open_llama_3b
   - openlm-research/open_llama_3b_v2
   - openlm-research/open_llama_7b
   - openlm-research/open_llama_7b_v2
   - paulml/OGNO-7B
   - pierreguillou/gpt2-small-portuguese
   - projecte-aina/FLOR-1.3B
   - projecte-aina/FLOR-6.3B
   - projecte-aina/FLOR-760M
+  - projecte-aina/aguila-7b
   - pucpr/gpt2-bio-pt
+  - recogna-nlp/GemBode-2b-it
+  - recogna-nlp/Phi-Bode
   - recogna-nlp/bode-13b-alpaca-pt-br
   - recogna-nlp/bode-7b-alpaca-pt-br
   - recogna-nlp/gembode-2b-ultraalpaca
   - recogna-nlp/internlmbode-7b
   - recogna-nlp/mistral-bode
   - recogna-nlp/phi-bode-2-ultraalpaca
   - rhaymison/Llama-portuguese-13b-Luana-v0.2
+  - rhaymison/Mistral-portuguese-luana-7b
   - rhaymison/Mistral-portuguese-luana-7b-Mathematics
+  - rhaymison/Mistral-portuguese-luana-7b-chat
   - rhaymison/Mistral-portuguese-luana-7b-mental-health
   - rhaymison/Qwen-portuguese-luana-7b
+  - rhaymison/gemma-portuguese-2b-it
+  - rhaymison/gemma-portuguese-luana-2b
   - rishiraj/CatPPT
+  - rishiraj/CatPPT-base
   - semantixai/LloroV2
   - stabilityai/stablelm-2-12b
+  - stabilityai/stablelm-2-12b-chat
   - stabilityai/stablelm-2-1_6b
+  - stabilityai/stablelm-2-1_6b-chat
   - stabilityai/stablelm-2-zephyr-1_6b
   - stabilityai/stablelm-3b-4e1t
   - stabilityai/stablelm-base-alpha-3b
+  - stabilityai/stablelm-base-alpha-3b-v2
   - stabilityai/stablelm-base-alpha-7b
+  - stabilityai/stablelm-base-alpha-7b-v2
   - stabilityai/stablelm-zephyr-3b
   - state-spaces/mamba-1.4b-hf
   - state-spaces/mamba-130m-hf
   - state-spaces/mamba-2.8b-hf
   - state-spaces/mamba-370m-hf
   - state-spaces/mamba-790m-hf
+  - t5-base
+  - t5-large
+  - t5-small
   - teknium/OpenHermes-2-Mistral-7B
   - teknium/OpenHermes-2.5-Mistral-7B
   - tiiuae/falcon-40b
   - tiiuae/falcon-7b
   - togethercomputer/RedPajama-INCITE-7B-Base
   - togethercomputer/RedPajama-INCITE-Base-3B-v1
   - upstage/SOLAR-10.7B-Instruct-v1.0
   - upstage/SOLAR-10.7B-v1.0
   - wandgibaut/periquito-3B
   - xverse/XVERSE-13B
   - xverse/XVERSE-65B
+  - xverse/XVERSE-65B-2
   - xverse/XVERSE-7B

src/display/formatting.py CHANGED Viewed

@@ -35,7 +35,7 @@ def make_clickable_model(model_name, json_path=None, revision=None):
         if json_path is not None:
             details_link = f"https://huggingface.co/datasets/{RESULTS_REPO}/blob/main/{model_name}/{json_path}"
-    if revision is not None and revision != "main":
         if len(revision) > 12:
             revision = revision[:7]
         model_name += f" (rev: {revision})"

         if json_path is not None:
             details_link = f"https://huggingface.co/datasets/{RESULTS_REPO}/blob/main/{model_name}/{json_path}"
+    if revision is not None and revision != "" and revision != "main":
         if len(revision) > 12:
             revision = revision[:7]
         model_name += f" (rev: {revision})"

src/leaderboard/read_evals.py CHANGED Viewed

@@ -23,8 +23,8 @@ class EvalResult:
     org: str
     model: str
     model_sha: str # commit hash, "" if main
-    revision: str = "main"
     results: dict
     precision: Precision = Precision.Unknown
     model_type: ModelType = ModelType.Unknown # Pretrained, fine tuned, ...
     weight_type: WeightType = WeightType.Original # Original or Adapter
@@ -176,12 +176,6 @@ class EvalResult:
         average = round(sum(average)/len(average), 2)
         npm = round(sum(npm)/len(npm), 2)
-        rev_name = None
-        if self.revision != "main":
-            rev_name = self.revision
-            if rev_name > 10:
-                rev_name = rev_name[:7]
         data_dict = {
             "eval_name": self.eval_name,  # not a column, just a save name,
             AutoEvalColumn.precision.name: self.precision.value.name,
@@ -189,7 +183,7 @@ class EvalResult:
             AutoEvalColumn.model_type_symbol.name: self.model_type.value.symbol,
             AutoEvalColumn.weight_type.name: self.weight_type.value.name,
             AutoEvalColumn.architecture.name: self.architecture,
-            AutoEvalColumn.model.name: make_clickable_model(self.full_model, self.json_filename, revision=rev_name),
             AutoEvalColumn.dummy.name: self.full_model,
             AutoEvalColumn.revision.name: self.revision,
             AutoEvalColumn.average.name: average,

     org: str
     model: str
     model_sha: str # commit hash, "" if main
     results: dict
+    revision: str = "main"
     precision: Precision = Precision.Unknown
     model_type: ModelType = ModelType.Unknown # Pretrained, fine tuned, ...
     weight_type: WeightType = WeightType.Original # Original or Adapter
         average = round(sum(average)/len(average), 2)
         npm = round(sum(npm)/len(npm), 2)
         data_dict = {
             "eval_name": self.eval_name,  # not a column, just a save name,
             AutoEvalColumn.precision.name: self.precision.value.name,
             AutoEvalColumn.model_type_symbol.name: self.model_type.value.symbol,
             AutoEvalColumn.weight_type.name: self.weight_type.value.name,
             AutoEvalColumn.architecture.name: self.architecture,
+            AutoEvalColumn.model.name: make_clickable_model(self.full_model, self.json_filename, revision=self.revision),
             AutoEvalColumn.dummy.name: self.full_model,
             AutoEvalColumn.revision.name: self.revision,
             AutoEvalColumn.average.name: average,

update_models_in_readme.py CHANGED Viewed

@@ -17,11 +17,15 @@ import glob
 import json
 snapshot_download(repo_id=QUEUE_REPO, local_dir=EVAL_REQUESTS_PATH, repo_type="dataset", tqdm_class=None, etag_timeout=30)
 with open('model_list.txt', 'w') as fw:
-    for filepath in glob.glob(os.path.join(EVAL_REQUESTS_PATH, '**/*.json'), recursive=True):
-        with open(filepath, 'r') as f:
-            model_data = json.load(f)
-            if model_data['status'] == 'FINISHED':
-                print(model_data['model'])
-                fw.write('  - '+ model_data['model'] + '\n')

 import json
 snapshot_download(repo_id=QUEUE_REPO, local_dir=EVAL_REQUESTS_PATH, repo_type="dataset", tqdm_class=None, etag_timeout=30)
+all_models = []
+for filepath in glob.glob(os.path.join(EVAL_REQUESTS_PATH, '**/*.json'), recursive=True):
+    with open(filepath, 'r') as f:
+        model_data = json.load(f)
+        if model_data['status'] == 'FINISHED':
+            all_models.append(model_data['model'])
+all_models = sorted(list(set(all_models)))
 with open('model_list.txt', 'w') as fw:
+    for m in all_models:
+        print(m)
+        fw.write('  - '+ m + '\n')