2 2 2

Junxiong Wang

JunxiongWang

https://www.cs.cornell.edu/~junxiong/

jxiw

AI & ML interests

Attention Free Model / Subquadratic Language Models

Recent Activity

updated a model 5 days ago

JunxiongWang/Llama3.2-Mamba-3B-dpo

updated a model 5 days ago

JunxiongWang/Llama3.2-Mamba-3B-distill

updated a model 5 days ago

JunxiongWang/Llama3.2-Mamba2-3B-distill

View all activity

Organizations

Collections 7

Papers 3

arxiv:2408.15237

arxiv:2401.13660

arxiv:2212.10544

models 3

datasets 4

JunxiongWang/sftdatasetv3

Viewer • Updated Oct 7 • 12.4M • 126

JunxiongWang/sftdataset

Viewer • Updated Aug 28 • 11M • 193 • 1

JunxiongWang/llama3-ultrafeedback-armorm

Viewer • Updated Aug 27 • 61.8k • 83 • 1

JunxiongWang/testdataset

Viewer • Updated Jun 23 • 1M • 189

Junxiong Wang

AI & ML interests

Recent Activity

Organizations

Collections 7

JunxiongWang/Llama3.1-Mamba2-8B-dpo

JunxiongWang/Llama3.1-Mamba-8B-dpo

JunxiongWang/Llama3.2-Mamba2-3B-dpo

JunxiongWang/Llama3.2-Mamba-3B-dpo

JunxiongWang/Llama3.2-Mamba2-3B-distill

JunxiongWang/Llama3.2-Mamba-3B-distill

JunxiongWang/Llama3.1-Mamba2-8B-distill

JunxiongWang/Llama3.1-Mamba-8B-distill

Papers 3

models 3

JunxiongWang/MambaInLlama_0_50

JunxiongWang/MambaInLlama_0_75

JunxiongWang/MambaInLlama_0_875

datasets 4

JunxiongWang/sftdatasetv3

JunxiongWang/sftdataset

JunxiongWang/llama3-ultrafeedback-armorm

JunxiongWang/testdataset

Junxiong Wang

AI & ML interests

Recent Activity

Organizations

Collections 7

Papers 3

models 3 Sort: Recently updated

datasets 4 Sort: Recently updated

models 3

datasets 4