Edit Models filters

snow_simplified_japanese_corpus csebuetnlp/xlsum MBZUAI/Bactrian-X SkelterLabsInc/JaQuAD lmqg/qg_jaquad mkqa paws

Datasets with no match

imagenet-1k mozilla-foundation/common_voice_7_0 xtreme wikipedia mozilla-foundation/common_voice_11_0 common_voice conll2003 tweet_eval Open-Orca/OpenOrca marsyas/gtzan samsum LDJnr/Capybara bookcorpus fka/awesome-chatgpt-prompts HuggingFaceH4/ultrafeedback_binarized Open-Orca/SlimOrca Intel/orca_dpo_pairs HuggingFaceH4/ultrachat_200k clinc_oos OpenAssistant/oasst1 kde4 c4 jondurbin/airoboros-2.2.1 teknium/OpenHermes-2.5 cnn_dailymail garage-bAInd/Open-Platypus bigcode/starcoderdata facebook/voxpopuli cerebras/SlimPajama-627B mozilla-foundation/common_voice_13_0 super_glue TIGER-Lab/MathInstruct databricks/databricks-dolly-15k PolyAI/minds14 teknium/openhermes ag_news allenai/ultrafeedback_binarized_cleaned migtissera/Synthia-v1.3 google/fleurs billsum piqa jondurbin/airoboros-3.2 universal_dependencies lmsys/lmsys-chat-1m librispeech_asr jondurbin/truthy-dpo-v0.1 oscar tiiuae/falcon-refinedweb huggan/smithsonian_butterflies_subset meta-math/MetaMathQA Anthropic/hh-rlhf mc4 Vezora/Tested-22k-Python-Alpaca togethercomputer/RedPajama-Data-1T jondurbin/cinematika-v0.1 jondurbin/gutenberg-dpo-v0.1 mozilla-foundation/common_voice_8_0 tatsu-lab/alpaca ise-uiuc/Magicoder-Evol-Instruct-110K Muennighoff/natural-instructions codeparrot/apps facebook/belebele cakiki/rosetta-code wnut_17 ise-uiuc/Magicoder-OSS-Instruct-75K cc100 amazon_reviews_multi cais/mmlu microsoft/orca-math-word-problems-200k kingbri/PIPPA-shareGPT food101 HuggingFaceH4/no_robots argilla/distilabel-intel-orca-dpo-pairs camel-ai/math camel-ai/biology camel-ai/physics camel-ai/chemistry unalignment/toxic-dpo-v0.1 yahma/alpaca-cleaned ms_marco uonlp/CulturaX OpenAssistant/oasst_top1_2023-08-25 jondurbin/airoboros-3.1 gsm8k lemonilia/LimaRP scene_parse_150 LDJnr/Verified-Camel klue EleutherAI/pile relbert/semeval2012_relational_similarity m-a-p/CodeFeedback-Filtered-Instruction glaiveai/glaive-function-calling-v2 eli5 unalignment/toxic-dpo-v0.2 superb HuggingFaceTB/cosmopedia wikitext grimulkan/LimaRP-augmented b-mc2/sql-create-context PygmalionAI/PIPPA xnli m-a-p/Code-Feedback LDJnr/Pure-Dove cifar10 argilla/distilabel-capybara-dpo-7k-binarized stanfordnlp/SHP openchat/openchat_sharegpt4_dataset nvidia/HelpSteer unalignment/spicy-3.1 mozilla-foundation/common_voice_16_1 wikiann cppe-5 code_search_net cognitivecomputations/dolphin-coder mattpscott/airoboros-summarization mozilla-foundation/common_voice_16_0 financial_phrasebank natural_questions WhiteRabbitNeo/WRN-Chapter-1 GAIR/lima WhiteRabbitNeo/WRN-Chapter-2 yelp_review_full pubmed Open-Orca/SlimOrca-Dedup Squish42/bluemoon-fandom-1-1-rp-cleaned anon8231489123/ShareGPT_Vicuna_unfiltered BigTMiami/amazon_MICRO_helpfulness_dataset yahoo_answers_topics winogrande esb/datasets jondurbin/airoboros-2.2 bigcode/the-stack-dedup jondurbin/py-dpo-v0.1 Lajonbot/alpaca-dolly-chrisociepa-instruction-only-polish jondurbin/airoboros-gpt4-1.4.1 mnist metaeval/reclor LDJnr/LessWrong-Amplify-Instruct jondurbin/contextual-dpo-v0.1 derek-thomas/ScienceQA HPLT/hplt_monolingual_v1_2 ParisNeo/lollms_aware_dataset pg19 flax-sentence-embeddings/stackexchange_xml unicamp-dl/mmarco wikihow embedding-data/sentence-compression swag berkeley-nest/Nectar wikimedia/wikipedia gokuls/wiki_book_corpus_complete_processed_bert_dataset cognitivecomputations/dolphin search_qa stingning/ultrachat vicgalle/alpaca-gpt4 timdettmers/openassistant-guanaco dell-research-harvard/AmericanStories gooaq varun-v-rao/squad allenai/nllb embedding-data/PAQ_pairs embedding-data/WikiAnswers lmqg/qg_squad openai/summarize_from_feedback cognitivecomputations/samantha-data HuggingFaceM4/WebSight argilla/dpo-mix-7k embedding-data/altlex embedding-data/simple-wiki kejian/codeparrot-train-more-filter-3.3b-cleaned go_emotions stefan-it/co-funer lmqg/qg_subjqa totally-not-an-llm/EverythingLM-data-V3 liuhaotian/LLaVA-Instruct-150K wikisql mozilla-foundation/common_voice_9_0 banking77 allenai/ai2_arc assin2 mbpp embedding-data/SPECTER NbAiLab/NPSC QingyiSi/Alpaca-CoT tner/tweetner7 allenai/tulu-v2-sft-mixture teknium/GPTeacher-General-Instruct glaiveai/glaive-code-assistant detection-datasets/coco multi_news argilla/ultrafeedback-binarized-preferences-cleaned masakhaner mlabonne/chatml_dpo_pairs rotten_tomatoes bigcode/the-stack oscar-corpus/OSCAR-2301 wiki_lingua sahil2801/CodeAlpaca-20k ncbi_disease scientific_papers argilla/distilabel-math-preference-dpo LeoLM/OpenSchnabeltier fblgit/tree-of-knowledge JosephusCheung/GuanacoDataset allenai/dolma LeoLM/German_Poems LeoLM/German_Songs openslr LDJnr/Puffin abacusai/SystemChat sablo/oasst2_curated eli5_category BigTMiami/amazon_helpfulness vctk STEM-AI-mtl/Electrical-engineering bigbench allenai/c4 openbmb/UltraFeedback Norquinal/claude_multiround_chat_30k Lin-Chen/ShareGPT4V jondurbin/airoboros-gpt4-m2.0 HuggingFaceH4/cai-conversation-harmless allenai/MADLAD-400 assin Gustavosta/Stable-Diffusion-Prompts beomi/KoAlpaca-v1.1a facebook/multilingual_librispeech HuggingFaceH4/deita-10k-v0-sft Nerfgun3/bad_prompt THUDM/AgentInstruct grimulkan/theory-of-mind lmqg/qg_squadshifts athirdpath/DPO_Pairs-Roleplay-Alpaca-NSFW Doctor-Shotgun/no-robots-sharegpt liuhaotian/LLaVA-Pretrain Doctor-Shotgun/capybara-sharegpt conceptual_captions wenbopan/Fusang-v1 wenbopan/OpenOrca-zh-20k NbAiLab/NST JeanKaddour/minipile yhavinga/mc4_nl_cleaned roneneldan/TinyStories NeuralNovel/Neural-Story-v1 bigbio/med_qa multilingual_librispeech tiedong/goat kunishou/databricks-dolly-15k-ja mlabonne/orpo-dpo-mix-40k internlm/Agent-FLAN gsdf/EasyNegative mlsum Hello-SimpleAI/HC3 mlabonne/guanaco-llama2-1k cognitivecomputations/Dolphin-2.9 abacusai/SystemChat-1.1 Locutusque/function-calling-chatml esnli kmfoda/booksum CohereForAI/aya_dataset lambdalabs/pokemon-blip-captions IlyaGusev/ru_turbo_saiga timit_asr mrqa kaist-ai/Feedback-Collection IlyaGusev/ru_sharegpt_cleaned IlyaGusev/ru_turbo_alpaca knowrohit07/saraswati-stem meta-math/MetaMathQA-40K riddle_sense lksy/ru_instruct_gpt4 jondurbin/airoboros-2.1 ajibawa-2023/Code-290k-ShareGPT covid_qa_deepset aqua_rat FreedomIntelligence/alpaca-gpt4-deutsch FreedomIntelligence/evol-instruct-deutsch argilla/ultrafeedback-binarized-preferences covost2 jytjyt05/t_to_m7 fever openai/webgpt_comparisons IlyaGusev/oasst1_ru_main_branch OpenAssistant/OASST-DE chargoddard/rpguild lmqg/qg_esquad lmqg/qg_ruquad allenai/objaverse paws-x laion/laion2B-en OpenAssistant/oasst2 tydiqa bigcode/guanaco-commits deepmind/code_contests EleutherAI/the_pile_deduplicated imone/OpenOrca_FLAN laion/OIG RyokoAI/ShareGPT52K lmqg/qg_itquad c-s-ale/alpaca-gpt4-data emozilla/yarn-train-tokenized-16k-mistral togethercomputer/RedPajama-Data-1T-Sample cifar100 pszemraj/simple_wikipedia_LM dair-ai/emotion daily_dialog cats_vs_dogs lmqg/qg_koquad iamplus/Instruction_Tuning amazon_polarity nlpai-lab/kullm-v2 BAAI/COIG mozilla-foundation/common_voice_12_0 AmazonScience/massive iamtarun/python_code_instructions_18k_alpaca ami EleutherAI/proof-pile-2 open-web-math/open-web-math nvidia/OpenMathInstruct-1 kyujinpy/OpenOrca-KO NeuralNovel/Neural-DPO lmqg/qg_dequad svakulenk0/qrecc taskmaster2 djaym7/wiki_dialog qed mozilla-foundation/common_voice_10_0 maywell/ko_wikidata_QA ResplendentAI/Synthetic_Soul_1k flozi00/conversations mlqa squad_es german-nlp-group/german_common_crawl subjqa bigscience/xP3 stjiris/portuguese-legal-sentences-v0 DFKI-SLT/few-nerd cuad nli_tr mosaicml/dolly_hhrlhf kyujinpy/KOR-OpenOrca-Platypus-v3 Epiculous/Gnosis seedboxai/multitask_german_examples_32k Finnish-NLP/mc4_fi_cleaned mlfoundations/datacomp_1b bigscience/P3 Yaxin/SemEval2014Task4Raw TigerResearch/tigerbot-zhihu-zh-10k competitions/aiornot kyujinpy/KOpen-platypus Rogendo/English-Swahili-Sentence-Pairs IlyaGusev/ru_turbo_alpaca_evol_instruct nomic-ai/gpt4all_prompt_generations tatoeba kakaobrain/coyo-700m Azure99/blossom-chat-v1 shahules786/orca-chat snorkelai/Snorkel-Mistral-PairRM-DPO-Dataset mozilla-foundation/common_voice_15_0 nsmc ajibawa-2023/General-Stories-Collection THUDM/webglm-qa hkust-nlp/deita-10k-v0 bjoernp/tagesschau-2018-2023 Dahoas/full-hh-rlhf togethercomputer/RedPajama-Data-V2 mlabonne/chatml-OpenHermes2.5-dpo-binarized-alpha teknium/GPT4-LLM-Cleaned Norquinal/claude_multiround_chat_1k bertin-project/alpaca-spanish jondurbin/airoboros-3.0 vivos fnlp/moss-003-sft-data allenai/WildChat segments/sidewalk-semantic Salesforce/dialogstudio gretelai/synthetic_text_to_sql squad_it cardiffnlp/super_tweeteval reginaboateng/cleaned_ebmnlp_pico Yukang/LongAlpaca-16k-length augmxnt/ultra-orca-boros-en-ja-v1 eugenesiow/Div2k wikitablequestions visual_genome IlyaGusev/gazeta bigcode/commitpackft ydshieh/coco_dataset_script mattymchen/refinedweb-3m Severian/Biomimicry kunishou/hh-rlhf-49k-ja bjoernp/ultrachat_de glaiveai/glaive-code-assistant-v2 CollectiveCognition/chats-data-2023-09-27 jondurbin/bagel-v0.3 argilla/OpenHermes2.5-dpo-binarized-alpha Locutusque/hyperion-v2.0 RyokoAI/Fandom23K milashkaarshif/MoeGirlPedia_wikitext_raw_archive liwu/MNBVC xquad ajibawa-2023/Children-Stories-Collection large_spanish_corpus 1aurent/NCT-CRC-HE 1aurent/PatchCamelyon hltcoe/tdist-msmarco-scores gsarti/change_it chizhikchi/CARES MinervaAI/Aesir-Preview quoref iamplus/Conversational_Data lucas-meyer/asr_af facebook/anli eugenesiow/Set5 Dahoas/synthetic-instruct-gptj-pairwise CohereForAI/aya_collection laion/laion-coco the_pile_books3 common_language big_patent fmars/wiki_stem Severian/Bio-Design-Process jerryjalapeno/nart-100k-synthetic Locutusque/hercules-v4.0 LIUM/tedlium Himitsui/Lewd-Assistant-v1 HuggingFaceH4/CodeAlpaca_20K Severian/Internal-Knowledge-Map mwitiderrick/SwahiliPlatypus RUCKBReasoning/TableLLM-SFT open_subtitles McGill-NLP/WebLINX ConvLab/multiwoz21 lucas-meyer/asr_xh tiagoblima/qg_squad_v1_pt deepset/germanquad Amod/mental_health_counseling_conversations eugenesiow/Set14 eugenesiow/BSD100 eugenesiow/Urban100 tals/vitaminc Universal-NER/Pile-NER-type knkarthick/dialogsum poloclub/diffusiondb embedding-data/QQP_triplets gigaword pankajmathur/orca_mini_v1_dataset jondurbin/airoboros-gpt4-1.2 newsqa Fredithefish/openassistant-guanaco-unfiltered Xilabs/PIPPA-alpaca kyujinpy/orca_math_dpo TokenBender/code_instructions_122k_alpaca_style VMware/open-instruct-v1-oasst-dolly-hhrlhf aeslc netcat420/MFANN Abirate/english_quotes id_liputan6 Norquinal/OpenCAI Locutusque/UltraTextbooks omarmomen/babylm_10M amazon_us_reviews mt_eng_vietnamese arcee-ai/sec-data-mini mbruton/spanish_srl mbruton/galician_srl BangumiBase/soundeuphonium sms_spam cosmos_qa cardiffnlp/tweet_topic_multi blended_skill_talk sbu_captions MaziyarPanahi/WizardLM_evol_instruct_V2_196k speech_commands izumi-lab/llm-japanese-dataset PocketDoc/Floyd-Text-Adventures NobodyExistsOnTheInternet/full120k PKU-Alignment/PKU-SafeRLHF winglian/evals openbmb/llava_zh theblackcat102/evol-codealpaca-v1 hkust-nlp/deita-6k-v0 tner/bc5cdr bc2gm_corpus EarthnDusk/Embeddings speechcolab/gigaspeech BangumiBase/lapisrelights starfishmedical/webGPT_x_dolly lener_br allenai/scirepeval conll2002 Muennighoff/P3 allenai/soda kunishou/oasst1-89k-ja Azure99/blossom-math-v2 Azure99/blossom-wizard-v1 Azure99/blossom-orca-v1 PocketDoc/Choose-Your-Story-Long-Text-Adventures adamo1139/AEZAKMI_v2 mlabonne/CodeLlama-2-20k jondurbin/airoboros-gpt4-1.4 Locutusque/Hercules-v3.0 VMware/open-instruct argilla/OpenHermesPreferences vicgalle/configurable-system-prompt-multitask arcd crows_pairs frgfm/imagenette s3nh/alpaca-dolly-instruction-only-polish mozilla-foundation/common_voice_6_0 yelp_polarity nomic-ai/gpt4all-j-prompt-generations nyu-mll/glue quora HuggingFaceM4/OBELICS pankajmathur/WizardLM_Orca laion/laion2B-multi wanng/wukong100m iapp_wiki_qa_squad ajibawa-2023/Python-Code-23k-ShareGPT nicholasKluge/instruct-aira-dataset BelleGroup/train_1M_CN jondurbin/airoboros-gpt4-1.3 argilla/Capybara-Preferences vngrs-ai/vngrs-web-corpus teknium/trismegistus-project cardiffnlp/tweet_topic_single NicolaiSivesind/human-vs-machine gfissore/arxiv-abstracts-2021 swahili IlyaGusev/gpt_roleplay_realm McGill-NLP/WebLINX-full copenlu/fever_gold_evidence linnaeus lj_speech ymoslem/FLEURS-GA-EN tum-nlp/IDMGSP Cohere/wikipedia-2023-11-embed-multilingual-v3 BangumiBase/seitokaiyakuindomo tasksource/mmlu poem_sentiment jnlpba CarperAI/pilev2-dev epfl-llm/guidelines SetFit/bbc-news Thaweewat/alpaca-cleaned-52k-th KnutJaegersberg/Auton oscar-corpus/OSCAR-2201 maywell/ko_Ultrafeedback_binarized ewof/koishi-instruct-metharme totally-not-an-llm/EverythingLM-data-V2 0-hero/Matter-0.1 Azure99/blossom-chat-v3 Azure99/blossom-math-v4 Azure99/blossom-wizard-v3 Azure99/blossom-orca-v3 BAAI/COIG-PC GraphWiz/GraphInstruct-RFT-72K DILAB-HYU/KoQuality NobodyExistsOnTheInternet/GiftedConvoBeforeEcons yizhongw/self_instruct fashion_mnist arxiv_dataset vietgpt/wikipedia_vi pn_summary indonli ruslanmv/ai-medical-chatbot AyoubChLin/CNN_News_Articles_2011-2022 Trelis/function_calling_v3 Ziyang/yfcc15m ymoslem/BitesizeIrish-GA-EN hotpot_qa caner iamplus/Orca edinburghcstr/ami michelecafagna26/hl BigTMiami/amazon_split_25M_reviews_20_percent_condensed medalpaca/medical_meadow_wikidoc m-a-p/COIG-CQIA BangumiBase/fatestaynightufotable CyberHarem/surtr_arknights shunk031/JGLUE miracl/miracl wiki_qa demelin/moral_stories Babelscape/multinerd euirim/goodwiki dmayhem93/ChatCombined HuggingFaceH4/databricks_dolly_15k grammarly/coedit Skylion007/openwebtext Aratako/Rosebleu-1on1-Dialogues-RP icybee/share_gpt_90k_v1 OpenLeecher/Teatime nickrosh/Evol-Instruct-Code-80k-v1 hendrycks/competition_math sem_eval_2018_task_1 gigant/african_accented_french sberquad commanderstrife/jnlpba chintagunta85/ncbi_disease sinhala-nlp/NSINA scikit-learn/iris Santp98/query_generated-title-secop2 diarizers-community/callhome BangumiBase/sousounofrieren hiyouga/DPO-En-Zh-20k trec truthful_qa silicone conll2012_ontonotesv5 fquad hate_speech_filipino arabic_billion_words tapaco sentiment140 ethos emo circa lince tab_fact squad_v1_pt thaisum harem web_questions quail math_qa hate_speech18 dbrd wi_locness germeval_14 lst20 squad_kor_v1 consumer-finance-complaints muchocine google_wellformed_query wiki_atomic_edits arabic_speech_corpus social_i_qa tweets_hate_speech_detection health_fact ade_corpus_v2 allocine msr_sqa wisesight_sentiment srwac svhn id_nergrit_corpus mozilla-foundation/common_voice_14_0 ehealth_kd conll2000 nq_open dream art app_reviews liar acronym_identification openai_humaneval multi_nli_mismatch conllpp quac winograd_wsc dutch_social sick medical_questions_pairs snips_built_in_intents hatexplain bigscience/xP3mt discofuse iwslt2017 dane code_x_glue_ct_code_to_text brwac wiki40b web_nlg code_x_glue_cc_defect_detection multi_woz_v22 mozilla-foundation/common_voice_17_0 aslg_pc12 sst bible_para empathetic_dialogues gem cmrc2018 fake_news_english wider_face hlgd cos_e head_qa discovery species_800 quarel sem_eval_2010_task_8 norne wiki_dpr monash_tsf para_crawl textvqa wiki_split scb_mt_enth_2020 xglue wili_2018 thaiqa_squad docred gap wiki_auto germaner reddit_tifu narrativeqa the_pile_openwebtext2 wino_bias hans wiki_hop wiqa codah definite_pronoun_resolution hope_edi pragmeval humicroedit has_part blog_authorship_corpus mc_taco numer_sense onestop_qa conceptual_12m id_newspapers_2018 cedr wongnai_reviews break_data mozilla-foundation/common_voice_6_1 hrwac kilt_tasks kor_nlu pib conv_ai_2 orange_sum climate_fever peoples_daily_ner labr setimes hard lc_quad quickdraw sharc_modified gnad10 generated_reviews_enth kor_3i4k lccc kd_conv nchlt thai_toxicity_tweet ted_multi kor_nli cornell_movie_dialog mozilla-foundation/common_voice_4_0 yahoo_answers_qa tamilmixsentiment reuters21578 crd3 catalonia_independence parsinlu_reading_comprehension com_qa newsgroup id_clickbait web_of_science clue scielo movie_rationales mozilla-foundation/common_voice_3_0 jeopardy ted_talks_iwslt doc2dial giga_fren hind_encorp nlu_evaluation_data craigslist_bargains mocha emotone_ar ronec ptb_text_only code_x_glue_cc_code_completion_line igbo_english_machine_translation imdb_urdu_reviews flue turku_ner_corpus xor_tydi_qa totto best2009 miam offenseval_dravidian xcsr xcopa squad_kor_v2 hyperpartisan_news_detection tsac event2Mind electricity_load_diagrams told-br medal offenseval2020_tr cmu_hinglish_dog turkic_xwmt bsd_ja_en disfl_qa emea tweet_qa kor_hate hybrid_qa reclor hate_speech_portuguese enwik8 ted_iwlst2013 math_dataset newsph_nli id_panl_bppt para_pat code_x_glue_tc_text_to_code conv_ai conv_ai_3 hausa_voa_ner proto_qa prachathai67k red_caps roman_urdu_hate_speech sede menyo20k_mt eurlex mozilla-foundation/common_voice_1_0 xsum_factuality xquad_r kelm msra_ner tlc nkjp-ner squad_adversarial medical_dialog makhzan spanish_billion_words ubuntu_dialogs_corpus wiki_bio recipe_nlg time_dial reasoning_bg flores tashkeela

Models

7

new Full-text search

Active filters: snow_simplified_japanese_corpus

TheBloke/OpenOrca_Stx-GGUF

Updated Sep 27, 2023 • 303 • 4

TheBloke/OpenOrca_Stx-GPTQ

Text Generation • Updated Sep 27, 2023 • 2 • 1

TheBloke/OpenOrca_Stx-AWQ

Text Generation • Updated Nov 9, 2023 • 2 • 1

ybelkada/japanese-dummy-tokenizer

Updated Jul 11, 2022 • 3

aerner/lm-v1

Text Generation • Updated May 25, 2023 • 5 • 1

aerner/lm-v2

Text Generation • Updated Jun 9, 2023 • 143

lightblue/openorca_stx

Text Generation • Updated Oct 2, 2023 • 78 • 16