Inference Optimization

community

AI & ML interests

None defined yet.

Recent Activity

nm-research updated a model about 6 hours ago

inference-optimization/Qwen3-8B-speculator.dflash.swa.causal-qwen235b-instruct-bs16.adamw-g7-ckpt5

nm-research published a model about 6 hours ago

inference-optimization/Qwen3-8B-speculator.dflash.swa.causal-qwen235b-instruct-bs16.adamw-g7-ckpt5

ChibuUkachi updated a model about 8 hours ago

inference-optimization/Qwen3-30B-A3B-speculator.dflash

View all activity

Collections 3

View 3 collections

models 205

inference-optimization/Qwen3-30B-A3B-speculator.dflash

0.7B • Updated about 4 hours ago • 254

inference-optimization/Qwen3-8B-speculator.dflash.swa.causal-qwen235b-instruct-bs16.adamw-g7-ckpt5

2B • Updated about 4 hours ago

inference-optimization/Qwen3-8B-DFlash-b16-fullattn-muon1e3-ckpt5

2B • Updated 3 days ago • 16

inference-optimization/Qwen3-8B-DFlash-b16-fullattn-muon1e3-ckpt4

2B • Updated 4 days ago • 10

inference-optimization/Qwen3-8B-DFlash-b16-fullattn-muon1e3-ckpt0

2B • Updated 4 days ago • 43

inference-optimization/Qwen3.5-397B-A17B-FP8-dynamic-speculator.dflash

2B • Updated 4 days ago • 127

inference-optimization/Qwen3-8B-DFlash-b16-fullattn-muon1e3-ckpt3

2B • Updated 4 days ago • 18

inference-optimization/Qwen3-8B-DFlash-b16-fullattn-muon1e3-ckpt2

2B • Updated 5 days ago • 22

inference-optimization/Qwen3-8B-DFlash-b16-fullattn-muon1e3-ckpt1

2B • Updated 5 days ago • 23

inference-optimization/Qwen3-8B-DFlash-b16-fullattn-muon-ckpt2

2B • Updated 5 days ago • 39

View 205 models

datasets 27

inference-optimization/dflash-qwen3-8b-qwen235b-instruct-bs16-prepared-data

Preview • Updated 5 days ago • 46

inference-optimization/every-eval-ever-demo

Viewer • Updated 27 days ago • 1 • 39

inference-optimization/DeepSeek-V4-Flash-responses

Viewer • Updated 27 days ago • 508k • 80

inference-optimization/Qwen3.5-4B-responses

Viewer • Updated Jun 10 • 7.47k • 76

inference-optimization/Qwen3.5-0.8B-responses

Viewer • Updated Jun 4 • 7.47k • 149

inference-optimization/Qwen3.5-9B-responses

Viewer • Updated Jun 4 • 7.67k • 69

inference-optimization/Qwen3-8B-Regenerated-Collection

Preview • Updated Jun 2 • 129

inference-optimization/Qwen3-30B-A3B-responses

Preview • Updated Jun 2 • 59

inference-optimization/gpt-oss-120b-responses

Preview • Updated Jun 2 • 78

inference-optimization/Qwen3-32B-responses

Preview • Updated Jun 2 • 43

View 27 datasets