Holden's picture

1 3 6

Holden

hodlen

·

hodlen

AI & ML interests

None yet

Organizations

hodlen's activity

upvoted 2 papers 9 months ago

PowerInfer-2: Fast Large Language Model Inference on a Smartphone

Paper • 2406.06282 • Published Jun 10, 2024 • 38

Turbo Sparse: Achieving LLM SOTA Performance with Minimal Activated Parameters

Paper • 2406.05955 • Published Jun 10, 2024 • 27

upvoted a paper about 1 year ago

PowerInfer: Fast Large Language Model Serving with a Consumer-grade GPU

Paper • 2312.12456 • Published Dec 16, 2023 • 42