Attentive - a bfuzzy1 Collection

bfuzzy1 's Collections

RL

acheron

Gunny

Agents

Agentic-ly agentic

Don't hate - evaluate

Generation Nation

Nifty

Attentive

updated 6 days ago

RetrievalAttention: Accelerating Long-Context LLM Inference via Vector Retrieval

Paper • 2409.10516 • Published Sep 16 • 39
MH-MoE:Multi-Head Mixture-of-Experts

Paper • 2411.16205 • Published Nov 25 • 23