Inference Optimization

community

AI & ML interests

None defined yet.

Recent Activity

ChibuUkachi updated a dataset about 5 hours ago

inference-optimization/every-eval-ever-demo

alexmarques published a dataset about 7 hours ago

inference-optimization/gpt-oss-120b-responses

orestis-z updated a model about 8 hours ago

inference-optimization/Qwen3-8B-speculators.peagle-qwen3arch-ckpt4

View all activity

inference-optimization 's models 386

inference-optimization/Qwen3-8B-speculators.peagle-qwen3arch-ckpt4

2B • Updated about 8 hours ago

inference-optimization/Qwen3-30B-A3B-Instruct-2507-speculator.dflash

0.7B • Updated about 9 hours ago

inference-optimization/Qwen3-8B-speculator.dflash.swa.non-qwen3-step21004

2B • Updated about 10 hours ago

inference-optimization/Laguna-XS.2-speculator.dflash-Qwen235B-500k-ckpt4

0.6B • Updated 1 day ago • 41

inference-optimization/Qwen3-8B-speculator.dflash.swa.non-qwen3-step126024

2B • Updated 1 day ago • 74

inference-optimization/Qwen3-8B-speculator.dflash.swa.non-qwen3-step56712

2B • Updated 4 days ago • 408

inference-optimization/Laguna-XS.2-speculator.dflash-Qwen235B-500k-ckpt3

0.6B • Updated 4 days ago • 113

inference-optimization/Laguna-XS.2-speculator.dflash-Qwen235B-500k-ckpt2

0.6B • Updated 5 days ago • 44

inference-optimization/Qwen3-8B-speculator.dflash.swa.non-qwen3-step21k

2B • Updated 6 days ago • 68

inference-optimization/Qwen3-8B-from-Qwen3-8B_regen-speculators.eagle3-qwen3arch-ckpt1

1B • Updated 6 days ago • 10

inference-optimization/Laguna-XS.2-speculator.dflash-Qwen235B-500k-ckpt1-20260609-0052

0.6B • Updated 7 days ago • 6

inference-optimization/Qwen3-8B-speculator.dflash.swa.non-qwen3-ep0p11

2B • Updated 7 days ago • 109

inference-optimization/Laguna-XS.2-speculator.dflash-Qwen235B-500k-ckpt1

0.6B • Updated 8 days ago • 222

inference-optimization/Laguna-XS.2-speculator.dflash-Qwen235B-500k-ckpt0.5

0.6B • Updated 8 days ago • 14

inference-optimization/Qwen3-8B-speculator.dflash.swa.unified-ep0p28

2B • Updated 8 days ago • 2

inference-optimization/Qwen3-8B-speculator.dflash.swa.unified-ep0p19

2B • Updated 8 days ago • 1

inference-optimization/DFlash-SWA-Causal-Qwen3-8B-Magpie-Ultrachat

2B • Updated 11 days ago • 363

inference-optimization/DFlash-SWA-Causal-Qwen3-8B-PerfectBlend

2B • Updated 11 days ago • 52

inference-optimization/Laguna-XS.2-speculator.dflash-Qwen235B-500k-ckpt0

0.6B • Updated 11 days ago • 108

inference-optimization/gpt-oss-2.5B-A1.3B

3B • Updated 13 days ago • 21

inference-optimization/Llama-4-Scout-1.7B-0.4B-Instruct

Image-Text-to-Text • 2B • Updated 13 days ago • 23

inference-optimization/ctest-Qwen3.5-9B-sliding-window-all-speculator.dflash

2B • Updated 13 days ago • 39

inference-optimization/Llama-3.2-0.5B-Instruct

Text Generation • 0.5B • Updated 13 days ago • 4.26k

inference-optimization/ctest-Qwen3.6-27B-speculator-regen.dflash

3B • Updated 13 days ago • 20 • 1

inference-optimization/ctest-Qwen3.5-9B-sliding-window-speculator.dflash

2B • Updated 13 days ago • 57

inference-optimization/Laguna-XS.2-speculator.dflash-Qwen235B-ckpt6

0.6B • Updated 14 days ago • 108

inference-optimization/Laguna-XS.2-speculator.dflash-Qwen235B-ckpt5

0.6B • Updated 14 days ago • 448

inference-optimization/Laguna-XS.2-speculator.dflash-Qwen235B-ckpt4

0.6B • Updated 15 days ago • 120

inference-optimization/Laguna-XS.2-speculator.dflash-Qwen235B-ckpt3

0.6B • Updated 15 days ago • 347

inference-optimization/Laguna-XS.2-speculator.dflash-Qwen235B-ckpt2

0.6B • Updated 18 days ago • 133