BEEspoke Data

community

https://www.bees.org/

Activity Feed

AI & ML interests

'an LLM is only as good as the dataset it was trained on' - Sun Tzu

Recent Activity

pszemraj updated a model 1 day ago

BEE-spoke-data/wordpiece-tokenizer-32k-en_code-msp

pszemraj updated a model 1 day ago

BEE-spoke-data/wordpiece-tokenizer-32k-en_code-orig

pszemraj updated a collection 6 days ago

tokenizers

View all activity

Organization Card

Community About org cards

🐝📊💁

Collections 7

spaces 1

pinned

Running

BeeCoder Demo

🐝

models 55

datasets 79

BEE-spoke-data/napierone-pdf-olmOCR

Viewer • Updated 14 days ago • 19k • 37

BEE-spoke-data/LONGCOT-merged-1M

Viewer • Updated Jan 19 • 1.7M • 160 • 1

BEE-spoke-data/govdocs1-by-extension

Viewer • Updated Jan 3 • 733k • 484 • 1

BEE-spoke-data/cosmopedia-v2-mincols

Viewer • Updated Jan 3 • 39.1M • 72

BEE-spoke-data/reddit-title-body-hf

Viewer • Updated Jan 2 • 251M • 110 • 4

BEE-spoke-data/bigpatent-all

Viewer • Updated Jan 2 • 2.43M • 104

BEE-spoke-data/google_wellformed_query-hf

Viewer • Updated Dec 20, 2024 • 25.1k • 59

BEE-spoke-data/fingpt-all-pr_format

Viewer • Updated Nov 26, 2024 • 418k • 18 • 1

BEE-spoke-data/fingpt-all

Viewer • Updated Nov 26, 2024 • 418k • 21

BEE-spoke-data/TxT360-5M-sample-en

Viewer • Updated Oct 11, 2024 • 10M • 64 • 3

BEEspoke Data

AI & ML interests

Recent Activity

Collections 7

BEE-spoke-data/smol_llama-101M-GQA

BEE-spoke-data/smol_llama-81M-tied

BEE-spoke-data/smol_llama-220M-GQA

BEE-spoke-data/verysmol_llama-v11-KIx2

BEE-spoke-data/smol_llama-220M-openhermes

BEE-spoke-data/smol_llama-220M-open_instruct

BEE-spoke-data/beecoder-220M-python

BEE-spoke-data/zephyr-220m-sft-full

spaces 1

BeeCoder Demo

models 55

BEE-spoke-data/wordpiece-tokenizer-32k-en_code-msp

BEE-spoke-data/wordpiece-tokenizer-32k-en_code-orig

BEE-spoke-data/bpe-tokenizer-32k-smolNeoX

BEE-spoke-data/pegasus-x-base-synthsumm_open-16k

BEE-spoke-data/tFINE-680m-e32-d16-gqa-flan

BEE-spoke-data/tFINE-680m-e32-d16-infinity_instruct-L2

BEE-spoke-data/tFINE-900m-e16-d32-instruct_2e

BEE-spoke-data/tFINE-900m-instruct-orpo

BEE-spoke-data/smol_llama-220M-openhermes

BEE-spoke-data/tFINE-900m-e16-d32-instruct

datasets 79

BEE-spoke-data/napierone-pdf-olmOCR

BEE-spoke-data/LONGCOT-merged-1M

BEE-spoke-data/govdocs1-by-extension

BEE-spoke-data/cosmopedia-v2-mincols

BEE-spoke-data/reddit-title-body-hf

BEE-spoke-data/bigpatent-all

BEE-spoke-data/google_wellformed_query-hf

BEE-spoke-data/fingpt-all-pr_format

BEE-spoke-data/fingpt-all

BEE-spoke-data/TxT360-5M-sample-en

AI & ML interests

Recent Activity

Team members 9

Collections 7

spaces 1

BeeCoder Demo

models 55 Sort: Recently updated

datasets 79 Sort: Recently updated

models 55

datasets 79