6 10 5

Xin Dong

SimonX

AI & ML interests

None yet

Recent Activity

upvoted a paper 4 days ago

CLIMB: CLustering-based Iterative Data Mixture Bootstrapping for Language Model Pre-training

liked a dataset 4 days ago

nvidia/ClimbMix

upvoted a paper 5 days ago

A Silver Bullet or a Compromise for Full Attention? A Comprehensive Study of Gist Token-based Context Compression

View all activity

Organizations

SimonX's activity

upvoted a paper 4 days ago

CLIMB: CLustering-based Iterative Data Mixture Bootstrapping for Language Model Pre-training

Paper • 2504.13161 • Published 5 days ago • 86

liked a dataset 4 days ago

nvidia/ClimbMix

Updated about 13 hours ago • 462 • 18

upvoted a paper 5 days ago

A Silver Bullet or a Compromise for Full Attention? A Comprehensive Study of Gist Token-based Context Compression

Paper • 2412.17483 • Published Dec 23, 2024 • 34

commented a paper 5 days ago

A Silver Bullet or a Compromise for Full Attention? A Comprehensive Study of Gist Token-based Context Compression

Paper • 2412.17483 • Published Dec 23, 2024 • 34 •

updated a dataset 7 days ago

data4elm/ELMB-ChatRAG

Viewer • Updated 7 days ago • 8.41k • 22

published a dataset 7 days ago

data4elm/ELMB-ChatRAG

Viewer • Updated 7 days ago • 8.41k • 22

updated a dataset 7 days ago

data4elm/ELMB-Reasoning

Viewer • Updated 7 days ago • 503 • 27

published a dataset 7 days ago

data4elm/ELMB-Reasoning

Viewer • Updated 7 days ago • 503 • 27

updated a dataset 7 days ago

data4elm/ELMB-RolePlay

Viewer • Updated 7 days ago • 7.51k • 30

published a dataset 7 days ago

data4elm/ELMB-RolePlay

Viewer • Updated 7 days ago • 7.51k • 30

updated a dataset 7 days ago

data4elm/ELMB-FunctionCalling

Viewer • Updated 7 days ago • 400 • 20

published a dataset 7 days ago

data4elm/ELMB-FunctionCalling

Viewer • Updated 7 days ago • 400 • 20

upvoted a paper about 1 month ago

Hymba: A Hybrid-head Architecture for Small Language Models

Paper • 2411.13676 • Published Nov 20, 2024 • 45

upvoted a collection about 2 months ago

Hymba

Collection

A series of Hybrid Small Language Models. • 2 items • Updated 8 days ago • 29

upvoted a collection 3 months ago

🪐 SmolLM

Collection

A series of smol LLMs: 135M, 360M and 1.7B. We release base and Instruct models as well as the training corpus and some WebGPU demos • 12 items • Updated 22 days ago • 223

upvoted 2 papers 4 months ago

Falcon Mamba: The First Competitive Attention-free 7B Language Model

Paper • 2410.05355 • Published Oct 7, 2024 • 36

NVILA: Efficient Frontier Visual Language Models

Paper • 2412.04468 • Published Dec 5, 2024 • 60

updated a model 4 months ago

nvidia/Hymba-1.5B-Instruct

Text Generation • Updated Jan 2 • 3.38k • 228

liked a model 4 months ago

yujiepan/hymba-tiny-random

Text Generation • Updated Dec 6, 2024 • 1 • 1

updated a model 4 months ago

nvidia/Hymba-1.5B-Base

Text Generation • Updated Jan 2 • 1.93k • 140